Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/74601
Tipo: Dissertação
Título : Um Novo Modelo Generativo para Descrições Textuais de Imagens Médicas Utilizando Transformadores Realçados com Redes Neurais Convolucionais
Autor : Barreto, Artur Gomes
Tutor: Albuquerque, Victor Hugo Costa de
Palabras clave en portugués brasileño: Processamento Digital de Imagem;ROCO;Processamento de Linguagem Natural;Engenharia Biomédica;Transferência de Conhecimento
Palabras clave en inglés: Digital Image Processing;Natural Language Processing;Transfer Learning;Biomedical Engineering;ROCO
Fecha de publicación : 2023
Citación : BARRETO, A.G. Um Novo Modelo Generativo para Descrições Textuais de Imagens Médicas Utilizando Transformadores Realçados com Redes Neurais Convolucionais. 2023. 130f. Dissertação (Mestrado em Engenharia Elétrica) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2023.
Resumen en portugués brasileño: A geração automática de descrições para imagens médicas tem despertado um interesse crescente na área da saúde, devido ao seu potencial para auxiliar profissionais na interpretação e análise de exames clínicos. Neste trabalho, explorou-se o desenvolvimento e avaliação de um modelo generativo de descrições de imagens médicas generalista utilizando o conjunto de dados público Radiology Objects in COntext (ROCO). Foi analisado o estado da arte, identificando abordagens baseadas em técnicas de processamento de linguagem natural e aprendizado de máquina. No entanto, foram identificadas algumas lacunas na literatura, como a falta de estudos que explorem o desempenho de modelos específicos para geração de descrições médicas, a necessidade de avaliação objetiva da qualidade das descrições geradas, a falta de generalização dos modelos para diferentes modalidades de imagem e condições médicas, bem como a falta de transparência e interpretabilidade dos modelos. Para abordar esses problemas, foi adotada uma estratégia metodológica que combinou técnicas de processamento de linguagem natural e modelos de reconhecimento de imagens para extrair atributos relevantes das imagens médicas e alimentá-los em um modelo generativo baseado em redes neurais, buscando a generalização dos modelos para diferentes modalidades de imagem e condições médicas. O treinamento do modelo foi realizado utilizando um conjunto de dados anotados e sua avaliação foi feita através das métricas acurácia e Bilingual Evaluation Understudy (BLEU). Os resultados obtidos mostraram resultados promissores na geração de descrições de imagens médicas, com uma acurácia de 0,7628 e um BLEU-1 de 0,5387. No entanto, a qualidade das descrições geradas ainda pode ser limitada, apresentando erros semânticos ou falta de detalhes específicos relevantes. Essas limitações podem ser atribuídas à disponibilidade e representatividade dos dados do conjunto de dados ROCO, bem como às técnicas utilizadas para a geração de descrições. Para pesquisas futuras, sugere-se explorar ainda mais a influência de diferentes técnicas e abordagens, como o uso de arquiteturas de redes neurais mais avançadas, implementar a interpretabilidade dos modelos generativos e empregar conjuntos de dados ainda mais amplos e diversificados. Além disso, é recomendada a realização de validação clínica para aprofundar a análise comparativa entre as descrições geradas e as fornecidas por especialistas.
Abstract: The automatic generation of descriptions for medical images has sparked increasing interest in the healthcare field due to its potential to assist professionals in the interpretation and analysis of clinical exams. This work explores the development and evaluation of a generalist generative model for medical image descriptions using the publicly available Radiology Objects in COntext (ROCO) dataset. The state of the art was analyzed, identifying approaches based on natural language processing techniques and machine learning. However, several gaps were identified in the literature, such as the lack of studies that explore the performance of specific models for medical description generation, the need for objective evaluation of the quality of generated descriptions, the lack of model generalization to different image modalities and medical conditions, as well as the lack of transparency and interpretability of the models. To address these issues, a methodological strategy was adopted, combining natural language processing techniques and image recognition models to extract relevant features from medical images and feed them into a generative model based on neural networks, aiming for model generalization to different image modalities and medical conditions. The model was trained using an annotated dataset, and its evaluation was performed using accuracy and Bilingual Evaluation Understudy (BLEU) metrics. The obtained results showed promising outcomes in the generation of descriptions for medical images, with an accuracy of 0.7628 and a BLEU-1 score of 0.5387. However, the quality of the generated descriptions may still be limited, exhibiting semantic errors or lacking specific relevant details. These limitations can be attributed to the availability and representativeness of the data in the ROCO dataset, as well as the techniques used for description generation. For future research, it is suggested to further explore the influence of different techniques and approaches, such as using more advanced neural network architectures, implementing interpretability of generative models and employing even larger and more diverse datasets. Additionally, conducting clinical validation is recommended to deepen the comparative analysis between generated descriptions and those provided by experts.
Descripción en portugués brasileño : Barreto, A.G. Um Novo Modelo Generativo para Descrições Textuais de Imagens Médicas Utilizando Transformadores Realçados com Redes Neurais Convolucionais. 2023. 130f. Dissertação (Mestrado em Engenharia Elétrica) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2023.
URI : http://repositorio.ufc.br/handle/riufc/74601
Lattes del autor: http://lattes.cnpq.br/6209124744697997
Lattes del tutor: http://lattes.cnpq.br/4186515742605446
Derechos de acceso: Acesso Aberto
Aparece en las colecciones: DEEL - Dissertações defendidas na UFC

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2023_dis_agbarreto.pdf3,53 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.