Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/82949
Type: Tese
Title: Interoperable web platform based on large language models for medical data analysis
Title in English: Interoperable web platform based on large language models for medical data analysis
Authors: Reis, Marcello Carvalho dos
Advisor: Albuquerque, Victor Hugo Costa de
Keywords in Brazilian Portuguese : Integração de dados (Computação);Interoperabilidade da informação em saúde;Inteligência Artificial;Padrão FHIR
Keywords in English : Data integration (Computer service);Health information interoperability;Artificial Intelligence;FHIR Standard
Knowledge Areas - CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Issue Date: 2024
Citation: REIS, Marcello Carvalho dos. Interoperable web platform based on large language models for medical data analysis. 2024. 80 f. Tese (Doutorado em Engenharia Elétrica) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2024.
Abstract in Brazilian Portuguese: Esta tese apresenta uma plataforma web interoperável para gestão de dados médicos, priorizando segurança e integração de informações de diversas fontes, utilizando o padrão FHIR (Fast Healthcare Interoperability Resources). O objetivo é otimizar a análise de prontuários médicos com inteligência artificial (IA) e aprendizado de máquina, oferecendo alertas automáticos e recomendações preventivas, em conformidade com a Lei Geral de Proteção de Dados (LGPD). A plataforma promove o compartilhamento eficiente de dados entre hospitais, clínicas, dispositivos remotos e sistemas de saúde, melhorando a precisão no diagnóstico e tratamento. A metodologia envolveu a criação de uma plataforma web segura e compatível com a LGPD, integrando dados por meio do FHIR para garantir interoperabilidade. Algoritmos de IA analisam dados médicos, geram alertas e fornecem recomendações personalizadas. O desempenho foi avaliado em testes controlados e de estresse, com foco na escalabilidade e segurança. Os resultados destacaram o desempenho promissor da técnica Retrieve Augmentation Generation (RAG) com modelos de embedding BAAI/bge-small-en. Métricas como BertF1, BertP e BertR variaram de 0,389 a 0,538, com média de 0,43, indicando consistência moderada. A média do score Bleu foi 0,442, refletindo diversidade na qualidade das respostas, enquanto as métricas Rouge apresentaram média de 0,326, indicando menor precisão. No desempenho com os conjuntos Chest X-rays e MedQA, Chest X-rays obteve scores mais altos, mas maior perplexidade (3,635e4), evidenciando desafios na geração de textos clínicos. MedQA mostrou maior diversidade de respostas (0,807), mas menor precisão. Na análise qualitativa, Chest X-rays apresentou maior similaridade semântica (média 0,767) em comparação a MedQA (média 0,754). Nos testes de carga, a plataforma manteve estabilidade com aumento de usuários, mas o tempo de resposta cresceu sob estresse, indicando gargalos em cenários de alta demanda. Conclui-se que a plataforma é uma ferramenta promissora para integrar dados médicos e apoiar decisões clínicas. O padrão FHIR garantiu interoperabilidade, enquanto a IA foi eficaz na análise de registros e emissão de alertas. São necessários ajustes em tempos de resposta sob alta carga e melhorias na infraestrutura e experiência móvel para maior adesão de pacientes.
Abstract: This Thesis presents an interoperable web platform for managing medical data, prioritizing security and integration of information from multiple sources using FHIR (Fast Healthcare Interoperability Resources). The objective is to optimize medical record analysis with artificial intelligence (AI) and machine learning, offering automatic alerts and preventive recommendations while complying with the General Data Protection Law (LGPD). The platform facilitates efficient sharing of data among hospitals, clinics, remote devices, and healthcare systems, improving diagnostic and treatment accuracy. The methodology involved creating a secure, LGPD-compliant web platform, the integration of data through FHIR to ensure interoperability. AI algorithms analyze medical data, generate alerts, and provide personalized recommendations. Performance was assessed in controlled and stress tests, focusing on scalability and security. Results highlighted promising performance of the Retrieve Augmentation Generation (RAG) technique with BAAI/bge-small-en embedding models. Metrics such as BertF1, BertP, and BertR ranged from 0.389 to 0.538, averaging 0.43, indicating moderate consistency. The average Bleu score was 0.442, reflecting diverse response quality, while Rouge metrics averaged 0.326, indicating lower precision. Performance with Chest X-rays and MedQA datasets showed better results with Chest X-rays, achieving higher scores but higher perplexity (3.635e4), indicating challenges in generating clinical text. MedQA showed greater response diversity (0.807) but lower precision. In qualitative analysis, Chest X-rays demonstrated higher semantic similarity (mean 0.767) compared to MedQA (mean 0.754). During load testing, the platform remained stable as user numbers increased, but response times grew under stress, suggesting bottlenecks in high-demand scenarios. In conclusion, the platform is a promising tool for integrating medical data and supporting clinical decisions. The FHIR standard ensured interoperability, while AI effectively analyzed records and issued alerts. Adjustments are needed in response times under heavy loads and improvements in infrastructure and mobile experience to encourage greater patient adoption.
Description in Brazilian Portuguese: Este documento está disponível online com base na Portaria no 348, de 08 de dezembro de 2022, disponível em: https://biblioteca.ufc.br/wp-content/uploads/2022/12/portaria348-2022.pdf, que autoriza a digitalização e a disponibilização no Repositório Institucional (RI) da coleção retrospectiva de TCC, dissertações e teses da UFC, sem o termo de anuência prévia dos autores. Em caso de trabalhos com pedidos de patente e/ou de embargo, cabe, exclusivamente, ao autor(a) solicitar a restrição de acesso ou retirada de seu trabalho do RI, mediante apresentação de documento comprobatório à Direção do Sistema de Bibliotecas.
URI: http://repositorio.ufc.br/handle/riufc/82949
Author's ORCID: https://orcid.org/0000-0002-1132-9034
Author's Lattes: https://lattes.cnpq.br/2607778393179184
Advisor's ORCID: https://orcid.org/0000-0003-3886-4309
Advisor's Lattes: http://lattes.cnpq.br/4186515742605446
Access Rights: Acesso Aberto
Appears in Collections:DEEL - Teses defendidas na UFC

Files in This Item:
File Description SizeFormat 
2024_tese_mcreis.pdf2,73 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.