Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/82949| Type: | Tese |
| Title: | Interoperable web platform based on large language models for medical data analysis |
| Title in English: | Interoperable web platform based on large language models for medical data analysis |
| Authors: | Reis, Marcello Carvalho dos |
| Advisor: | Albuquerque, Victor Hugo Costa de |
| Keywords in Brazilian Portuguese : | Integração de dados (Computação);Interoperabilidade da informação em saúde;Inteligência Artificial;Padrão FHIR |
| Keywords in English : | Data integration (Computer service);Health information interoperability;Artificial Intelligence;FHIR Standard |
| Knowledge Areas - CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
| Issue Date: | 2024 |
| Citation: | REIS, Marcello Carvalho dos. Interoperable web platform based on large language models for medical data analysis. 2024. 80 f. Tese (Doutorado em Engenharia Elétrica) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2024. |
| Abstract in Brazilian Portuguese: | Esta tese apresenta uma plataforma web interoperável para gestão de dados médicos, priorizando segurança e integração de informações de diversas fontes, utilizando o padrão FHIR (Fast Healthcare Interoperability Resources). O objetivo é otimizar a análise de prontuários médicos com inteligência artificial (IA) e aprendizado de máquina, oferecendo alertas automáticos e recomendações preventivas, em conformidade com a Lei Geral de Proteção de Dados (LGPD). A plataforma promove o compartilhamento eficiente de dados entre hospitais, clínicas, dispositivos remotos e sistemas de saúde, melhorando a precisão no diagnóstico e tratamento. A metodologia envolveu a criação de uma plataforma web segura e compatível com a LGPD, integrando dados por meio do FHIR para garantir interoperabilidade. Algoritmos de IA analisam dados médicos, geram alertas e fornecem recomendações personalizadas. O desempenho foi avaliado em testes controlados e de estresse, com foco na escalabilidade e segurança. Os resultados destacaram o desempenho promissor da técnica Retrieve Augmentation Generation (RAG) com modelos de embedding BAAI/bge-small-en. Métricas como BertF1, BertP e BertR variaram de 0,389 a 0,538, com média de 0,43, indicando consistência moderada. A média do score Bleu foi 0,442, refletindo diversidade na qualidade das respostas, enquanto as métricas Rouge apresentaram média de 0,326, indicando menor precisão. No desempenho com os conjuntos Chest X-rays e MedQA, Chest X-rays obteve scores mais altos, mas maior perplexidade (3,635e4), evidenciando desafios na geração de textos clínicos. MedQA mostrou maior diversidade de respostas (0,807), mas menor precisão. Na análise qualitativa, Chest X-rays apresentou maior similaridade semântica (média 0,767) em comparação a MedQA (média 0,754). Nos testes de carga, a plataforma manteve estabilidade com aumento de usuários, mas o tempo de resposta cresceu sob estresse, indicando gargalos em cenários de alta demanda. Conclui-se que a plataforma é uma ferramenta promissora para integrar dados médicos e apoiar decisões clínicas. O padrão FHIR garantiu interoperabilidade, enquanto a IA foi eficaz na análise de registros e emissão de alertas. São necessários ajustes em tempos de resposta sob alta carga e melhorias na infraestrutura e experiência móvel para maior adesão de pacientes. |
| Abstract: | This Thesis presents an interoperable web platform for managing medical data, prioritizing security and integration of information from multiple sources using FHIR (Fast Healthcare Interoperability Resources). The objective is to optimize medical record analysis with artificial intelligence (AI) and machine learning, offering automatic alerts and preventive recommendations while complying with the General Data Protection Law (LGPD). The platform facilitates efficient sharing of data among hospitals, clinics, remote devices, and healthcare systems, improving diagnostic and treatment accuracy. The methodology involved creating a secure, LGPD-compliant web platform, the integration of data through FHIR to ensure interoperability. AI algorithms analyze medical data, generate alerts, and provide personalized recommendations. Performance was assessed in controlled and stress tests, focusing on scalability and security. Results highlighted promising performance of the Retrieve Augmentation Generation (RAG) technique with BAAI/bge-small-en embedding models. Metrics such as BertF1, BertP, and BertR ranged from 0.389 to 0.538, averaging 0.43, indicating moderate consistency. The average Bleu score was 0.442, reflecting diverse response quality, while Rouge metrics averaged 0.326, indicating lower precision. Performance with Chest X-rays and MedQA datasets showed better results with Chest X-rays, achieving higher scores but higher perplexity (3.635e4), indicating challenges in generating clinical text. MedQA showed greater response diversity (0.807) but lower precision. In qualitative analysis, Chest X-rays demonstrated higher semantic similarity (mean 0.767) compared to MedQA (mean 0.754). During load testing, the platform remained stable as user numbers increased, but response times grew under stress, suggesting bottlenecks in high-demand scenarios. In conclusion, the platform is a promising tool for integrating medical data and supporting clinical decisions. The FHIR standard ensured interoperability, while AI effectively analyzed records and issued alerts. Adjustments are needed in response times under heavy loads and improvements in infrastructure and mobile experience to encourage greater patient adoption. |
| Description in Brazilian Portuguese: | Este documento está disponível online com base na Portaria no 348, de 08 de dezembro de 2022, disponível em: https://biblioteca.ufc.br/wp-content/uploads/2022/12/portaria348-2022.pdf, que autoriza a digitalização e a disponibilização no Repositório Institucional (RI) da coleção retrospectiva de TCC, dissertações e teses da UFC, sem o termo de anuência prévia dos autores. Em caso de trabalhos com pedidos de patente e/ou de embargo, cabe, exclusivamente, ao autor(a) solicitar a restrição de acesso ou retirada de seu trabalho do RI, mediante apresentação de documento comprobatório à Direção do Sistema de Bibliotecas. |
| URI: | http://repositorio.ufc.br/handle/riufc/82949 |
| Author's ORCID: | https://orcid.org/0000-0002-1132-9034 |
| Author's Lattes: | https://lattes.cnpq.br/2607778393179184 |
| Advisor's ORCID: | https://orcid.org/0000-0003-3886-4309 |
| Advisor's Lattes: | http://lattes.cnpq.br/4186515742605446 |
| Access Rights: | Acesso Aberto |
| Appears in Collections: | DEEL - Teses defendidas na UFC |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 2024_tese_mcreis.pdf | 2,73 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.