Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/47319
Type: | Dissertação |
Title: | Redes neurais convolucionais e energia de dobramento multiescala na descrição e análise de formas |
Authors: | Lopes, José Gerardo Fonteles |
Advisor: | Medeiros, Fátima Nelsizeuma Sombra de |
Keywords: | Teleinformática;Redes neurais (Computação);Processamento de imagens;Imagens digitais;Shape analysis;Convolutional neural networks;Shape descriptor;Content based image retrieval |
Issue Date: | 2019 |
Citation: | LOPES, J. G. F. Redes neurais convolucionais e energia de dobramento multiescala na descrição e análise de formas. 2019. 47 f. Dissertação (Mestrado em Engenharia de Teleinformática)–Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2019. |
Abstract in Brazilian Portuguese: | O reconhecimento automático de pílulas por meio de imagens digitais pode reduzir erros de administração de medicação por pacientes idosos e também possibilitar a polícia forense no rastreio de rotas comerciais de drogas ilegais. Considerando o crescente uso de redes neurais convolucionais (CNNs) em problemas de reconhecimento de padrões, neste trabalho é proposta a aplicação das redes convolucionais LeNet e Inception ResNet, assim como do descritor multiescala de formas Energia de Dobramento Multiescala (NMBE) na extração de atributos de imagens de bases públicas de Pílulas Lícitas e Ilícitas para fins de reconhecimento automático das mesmas. Realizamos experimentos para avaliar a generalização dos algoritmos de descrição de objetos em uma base de imagens do alfabeto internacional da linguagem de sinais (Hands). Avaliamos quantitativamente os resultados de classificação e recuperação de imagem baseada em conteúdo (CBIR) por meio das medidas de Acurácia e mean average precision (MAP). Na análise qualitativa utilizamos a Matriz U para a visualização do arranjo dos agrupamentos de formas. Os experimentos de classificação e CBIR mostraram que a LeNet superou a Inception Resnet e a NMBE com resultados acimas de 90% nas bases públicas que possuem quantidades de imagens suficientes para o seu treinamento, como as bases de Pílulas Lícitas e Hands. |
Abstract: | The automatic recognition of pills through image can reduce wrong drug administration in elderly patients and also enable forensic intelligence to establish links among illegal drug marketing. Considering the remarkable progress and performance of the convolutional neural networks (CNNs) in pattern recognition problems, this study proposes the application of neural network, namely LeNet and Inception ResNet as well as the normalize normalize multiscale bending energy (NMBE) for feature extraction of licit and illicit pills in order to develop algorithms for automatic recognition of pills. We assess the generalization of the algorithms in an image database from the international alphabet of sign language (Hands). We conduct classification and content-based image retrieval (CBIR) experiments and evaluate the results quantitatively using the Accuracy and mean average precision (MAP) measures. We perform the qualitative analysis through the U matrix for visualization of the cluster arrangement. The results showed that LeNet outperformed the Inception Resnet and NMBE for image databases with a great amount of images for training as the Licit Pills and Hands databases. |
URI: | http://www.repositorio.ufc.br/handle/riufc/47319 |
Appears in Collections: | DETE - Dissertações defendidas na UFC |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2019_dis_jgflopes.pdf | 5,74 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.