Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/85126| Tipo: | Tese |
| Título: | Sistema de auxílio ao diagnóstico do glaucoma em imagens do fundo de olho: método baseado em transfer learning e estimação usando regressão |
| Título em inglês: | Glaucoma diagnostic aid system using fundus images: a method based on transfer learning and estimation using regression |
| Autor(es): | Assis, Débora Ferreira de |
| Orientador: | Cortez, Paulo César |
| Coorientador: | Albuquerque, Victor Hugo Costa de |
| Palavras-chave em português: | Glaucoma;Redes neurais convolucionais;Diagnóstico por computador;Aprendizado de máquina |
| Palavras-chave em inglês: | Glaucoma;Convolutional neural networks;Diagnosis, computer-assisted;Machine learning |
| CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
| Data do documento: | 2026 |
| Citação: | ASSIS, Débora Ferreira de. Sistema de auxílio ao diagnóstico do glaucoma em imagens do fundo de olho: método baseado em transfer learning e estimação usando regressão. 2025. 140 f. Tese (Doutorado em Engenharia de Teleinformática) – Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2025. |
| Resumo: | O glaucoma é uma doença ocular crônica, causada principalmente pela degeneração gradual do nervo óptico. Esta doença é a principal causa de cegueira irreversível no mundo. Projeções da Organização Mundial de Saúde (OMS) sugerem que essa doença pode atingir 111,8 milhões de pessoas no mundo em 2040, especialmente em populações com acesso limitado a exames oftalmológicos regulares. Por possibilitar uma análise eficaz de grandes volumes de dados, técnicas de visão computacional têm contribuído no auxílio ao diagnóstico precoce de doenças, incluindo o glaucoma. Entretanto, demandam maior capacidade computacional. Logo, pesquisas por técnicas que apresentem menor custo computacional com taxas de acerto adequadas, é essencial para o rastreamento do glaucoma em áreas remotas ou com infraestrutura de saúde restrita. Assim, esta tese tem como objetivo propor um novo método de auxílio ao diagnóstico do glaucoma baseado em um modelo de regressão que prever as características de saída numa rede convolucional reduzida. Neste contexto, usam-se as bases de dados ACRIMA, AIROGS, LAG e RIM-ONE que são pré-processadas (padronizadas) para que todas as imagens estejam centralizadas no disco óptico e redimensionadas para o tamanho 224 x 224 x 3. Emprega-se uma arquitetura VGG16 reduzida para otimizar a extração e redução dimensional das características relevantes de imagens de fundo de olho durante o treinamento e, na etapa de teste, utiliza-se um modelo de regressão multivariada com regularização de Ridge que estima essas características a partir da imagem vetorizada para conservar a precisão do diagnóstico com menor custo computacional. Ademais, é implementado um sistema web que possibilita a triagem de casos de glaucoma por meio de análise de imagens do fundo de olho, além de suporte para dispositivos portáteis, permitindo o uso em locais com infraestrutura limitada. Para avaliar o desempenho do modelo de classificação do glaucoma, utilizam-se as métricas acurácia, precisão, sensibilidade, f1-score e especificidade. A partir dos resultados conclui-se que os modelos convolucionais destacaram pelo seu desempenho, principalmente para a configuração VGG16 (128, 512) com o critério de redução Minimum Redundancy Maximum Relevance (MRMR) nos mapas de características, no qual com a base ACRIMA alcançou sensibilidade de 97,14% e com a base RIM-ONE obteve sensibilidade de 86,54%, que são resultados melhores do que utilizando o modelo VGG16 original (512, 4096). Por fim, pode-se concluir que a redução na camada totalmente conectada das redes também reduz o custo computacional, sem perda substancial nas métricas avaliadas, sendo adequada para classificação. Como contribuições podem-se citar a adaptação de métodos de seleção para tornar os mapas de características de uma rede convolucional mais representativos, a aplicação de um modelo de regressão para prever as características aprendidas pela rede convolucional, e um sistema web funcional em diferentes dispositivos para auxiliar no diagnóstico automático do glaucoma, especialmente em dispositivos computacionalmente limitados. |
| Abstract: | Glaucoma is a chronic eye disease that affects the optic nerve, primarily caused by the gradual degeneration of the optic nerve. This disease is the leading cause of irreversible blindness worldwide. Projections from the World Health Organization suggest that this disease could affect 111.8 million people globally by 2040, particularly in populations with limited access to regular ophthalmic examinations. Due to their ability to efficiently analyze large volumes of data, computer vision techniques have contributed to the early diagnosis of diseases, including glaucoma. However, these techniques often require significant computational power. Therefore, research into methods that offer lower computational costs while maintaining adequate accuracy rates is essential for glaucoma screening in remote areas or regions with limited healthcare and communication infrastructure. Thus, the primary objective of this thesis is to propose a new method for assisting glaucoma diagnosis based on a regression model and a reduced convolutional neural network. In this context, the ACRIMA, AIROGS, LAG, and RIM-ONE databases are used and preprocessed (standardized) to center all images on the optic disc and resized to 224 x 224 x 3. A reduced VGG16 architecture is employed to optimize the extraction and dimensionality reduction of relevant features from fundus images during training. In the testing phase, a ridge regression model estimates these features from the vectorized image, preserving diagnostic accuracy while reducing computational costs. A web-based system is implemented to enable glaucoma screening through fundus image analysis, with support for portable devices, allowing usage in locations with limited infrastructure. To evaluate the performance of the glaucoma classification model, accuracy, precision, sensitivity, F1-score, and specificity metrics are used. The results indicate that convolutional models stood out in terms of performance, particularly the VGG16 (128, 512) configuration with the Minimum Redundancy Maximum Relevance (MRMR) feature selection criterion. This configuration achieved a sensitivity of 97.14% with the ACRIMA dataset and 86.54% with the RIM-ONE dataset, outperforming the original VGG16 model (512, 4096). Finally, it can be concluded that reducing the fully connected layer of neural networks also decreases computational costs without significant loss in evaluated metrics, making them suitable for classification tasks. This work's key contributions include the adaptation of selection methods to make the feature maps of a convolutional network more representative, the application of a regression model to predict the features learned by the convolutional network, and the development of a web-based system functional across different devices to assist in the automatic diagnosis of glaucoma, particularly on computationally limited devices. |
| Descrição: | Este documento está disponível online com base na Portaria no 348, de 08 de dezembro de 2022, disponível em: https://biblioteca.ufc.br/wp-content/uploads/2022/12/portaria348-2022.pdf, que autoriza a digitalização e a disponibilização no Repositório Institucional (RI) da coleção retrospectiva de TCC, dissertações e teses da UFC, sem o termo de anuência prévia dos autores. Em caso de trabalhos com pedidos de patente e/ou de embargo, cabe, exclusivamente, ao autor(a) solicitar a restrição de acesso ou retirada de seu trabalho do RI, mediante apresentação de documento comprobatório à Direção do Sistema de Bibliotecas. |
| URI: | http://repositorio.ufc.br/handle/riufc/85126 |
| Currículo Lattes do(s) Autor(es): | http://lattes.cnpq.br/5346773401665003 |
| ORCID do Orientador: | https://orcid.org/0000-0002-4020-3019 |
| Currículo Lattes do Orientador: | http://lattes.cnpq.br/5024602152304064 |
| ORCID do Coorientador: | https://orcid.org/0000-0003-3886-4309 |
| Currículo Lattes do Coorientador: | http://lattes.cnpq.br/4186515742605446 |
| Tipo de Acesso: | Acesso Aberto |
| Aparece nas coleções: | DETE - Teses defendidas na UFC |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| 2025_tese_dfassis.pdf | Tese | 9,15 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.