Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/78128
Tipo: Tese
Título: Uma nova abordagem para redes neurais convolucionais dinâmicas para sistemas CAD em ambiente federado
Autor(es): Silva, Bruno Riccelli dos Santos
Orientador: Cortez, Paulo César
Coorientador: Albuquerque, Victor Hugo Costa de
Palavras-chave em português: Aprendizagem profunda;Redes Neurais (Computação);Aprendizagem federada;Sistemas CAD/CAM
Palavras-chave em inglês: Deep learning;Neural Networks (Computing);Federated learning;CAD/CAM systems
CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Data do documento: 2024
Citação: SILVA, Bruno Riccelli dos Santos. Uma nova abordagem para redes neurais convolucionais dinâmicas para sistemas CAD em ambiente federado. 2024. 93 f. Tese (Doutorado em Engenharia de Teleinformática) – Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2024.
Resumo: No contexto de Inteligência Artificial, Redes neurais convolucionais apresentam-se como uma alternativa para identificação de padrões em imagens, as quais muitas vezes não são vistos a olho nu. Com o avanço de técnicas de aprendizado de máquina que demandam cada vez mais processamento e a grande quantidade de dados treinar essas técnicas, tem-se que o recurso computacional como uma limitação. Para lidar com esse problema, redes convolucionais dinâmicas que modificam suas arquiteturas foram implementadas para lidar com dispositivos com restrições de memória e processamento. Esta tese apresenta uma nova abordagem para redes convolucionais dinâmicas para adaptar sua arquitetura e pesos conforme os diferentes tipos de entrada, visando melhorar a eficiência e precisão na identificação de padrões em imagens biomédicas. A rede convolucional VGG-16 foi utilizada como base para implementação da abordagem proposta. A base de dados CIFAR10 foi utilizada para referência comparativa e cinco bases de imagens de glaucoma foram utilizadas para avaliar a desempenho da abordagem proposta a partir de imagens biomédicas. As métricas aplicadas para avaliar os modelos implementados são: acurácia, precisão, recall, f1 e quantidade de parâmetros da rede. Além disso, o teste de Wilcoxon é utilizado para avaliar diferenças estatísticas entre os resultados da arquitetura original e da dinâmica. Para a base de dados CIFAR-10, a abordagem proposta reduz o tamanho da rede VGG-16 original em até metade, com uma perda máxima de 7% na acurácia, precisão, recall e f1. Para a maioria das bases de dados, observa-se um comportamento equivalente ou superior das versões reduzidas, em relação à rede original, destacando-se para o conjunto de validação externa, o qual representa melhor situações do cotidiano em sistemas de auxílio ao diagnóstico. Por fim, a abordagem proposta é implementada em ambiente federado, visando realizar treinamento descentralizado em hospitais e garantindo a privacidade dos dados, além de maior robustez no modelo final. A partir dos resultados obtidos com a base de dados CIFAR-10 e seis bases de imagens de glaucoma evidenciam que a abordagem proposta reduz o tamanho da rede VGG-16 original em até metade, com perdas mínimas nas métricas acurácia, precision, recall e f1, sendo possível o uso da metodologia proposta em ambientes federados com restrições de processamento. A principal contribuição desta tese está na nova abordagem desenvolvida, a qual pode ser utilizada em quaisquer redes neurais convolucionais e transformando-as em redes dinâmicas.
Abstract: In the context of Artificial Intelligence, Convolutional Neural Networks (CNNs) present themselves as an alternative for identifying patterns in images, which are often not visible to the naked eye. With the advancement of machine learning techniques that demand increasing computational power and large amounts of data to train these techniques, computational resources become a limitation. To address this issue, dynamic convolutional networks that modify their architectures have been implemented to deal with devices with memory and processing constraints. This thesis presents a new approach to dynamic convolutional networks that adapt their architecture and weights according to different types of input, aiming to improve efficiency and accuracy in pattern identification in biomedical images. The VGG-16 convolutional network was used as the basis for implementing the proposed approach. The CIFAR-10 dataset was used for comparative reference, and five glaucoma image datasets were used to evaluate the performance of the proposed approach based on biomedical images. The metrics applied to evaluate the implemented models are: accuracy, precision, recall, F1-score, and the number of network parameters. Additionally, the Wilcoxon test is used to assess statistical differences between the results of the original and dynamic architectures. For the CIFAR-10 dataset, the proposed approach reduces the size of the original VGG-16 network by up to half, with a maximum loss of 7% in accuracy, precision, recall, and F1-score. For most of the datasets, the reduced versions perform equivalently or better compared to the original network, particularly in the external validation set, which better represents real-world situations in diagnostic support systems. Finally, the proposed approach is implemented in a federated environment, aiming to perform decentralized training in hospitals while ensuring data privacy and greater robustness in the final model. The results obtained with the CIFAR-10 dataset and six glaucoma image datasets show that the proposed approach reduces the size of the original VGG-16 network by up to half, with minimal losses in accuracy, precision, recall, and F1-score metrics, making it possible to use the proposed methodology in federated environments with processing constraints. The main contribution of this thesis lies is the new approach developed, which can be applied to any convolutional neural network, transforming them into dynamic networks.
Descrição: Este documento está disponível online com base na Portaria no 348, de 08 de dezembro de 2022, disponível em: https://biblioteca.ufc.br/wp-content/uploads/2022/12/portaria348-2022.pdf, que autoriza a digitalização e a disponibilização no Repositório Institucional (RI) da coleção retrospectiva de TCC, dissertações e teses da UFC, sem o termo de anuência prévia dos autores. Em caso de trabalhos com pedidos de patente e/ou de embargo, cabe, exclusivamente, ao autor(a) solicitar a restrição de acesso ou retirada de seu trabalho do RI, mediante apresentação de documento comprobatório à Direção do Sistema de Bibliotecas.
URI: http://repositorio.ufc.br/handle/riufc/78128
ORCID do(s) Autor(es): https://orcid.org/0000-0001-8189-7187
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/9288483499965859
ORCID do Orientador: https://orcid.org/0000-0002-4020-3019
Currículo Lattes do Orientador: http://lattes.cnpq.br/5024602152304064
Currículo Lattes do Coorientador: http://lattes.cnpq.br/4186515742605446
Tipo de Acesso: Acesso Embargado
Aparece nas coleções:DETE - Teses defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2024_tese_brssilva_09092024.pdf
🔒  Disponível em  2026-09-10
Tese5,06 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.