Desenvolvimento de um Largue Language Model: uma estratégia de aprimoramento de transcrições de anamneses médicas

Gonçalves, Yanna Torres

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/85078

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Carmo, Rafael Augusto Ferreira do	-
dc.contributor.author	Gonçalves, Yanna Torres	-
dc.date.accessioned	2026-03-05T16:05:54Z	-
dc.date.available	2026-03-05T16:05:54Z	-
dc.date.issued	2024	-
dc.identifier.citation	GONÇALVES, Yanna Torres. Desenvolvimento de um Largue Language Model: uma estratégia de aprimoramento de transcrições de anamneses médicas. 2026. 52 f. Trabalho de Conclusão de Curso (Graduação em Sistemas e Mídias Digitais) – Instituto UFC Virtual, Universidade Federal do Ceará, Fortaleza, 2024.	pt_BR
dc.identifier.uri	http://repositorio.ufc.br/handle/riufc/85078	-
dc.description.abstract	This work aims to explore the development of a Large Language Model (LLM) to enhance the transcription of patient records. The research involved two main stages: the first consisted of an initial benchmark of three language models (Phi3, Llama, and Mistral), evaluating their performance in the task of formatting anamneses, and the second focused on fine-tuning the Mistral model, based on qualitative and quantitative feedback from the evaluators. The Mistral model stood out in the benchmark due to its consistency and better results in agreement metrics, such as Kendall’s tau and Fleiss’ Kappa coefficients, although it was criticized for overloading details in its responses, impairing its objectivity. The Llama model performed the worst, with responses that were often irrelevant, while Phi3 showed moderate performance, but with issues in precision and excessive use of generic language. The fine-tuning of the Mistral model, despite attempts to correct the flaws, did not result in significant improvements, as the average evaluation score was slightly lower than the original model. The main contributions of this work include the comparison of language models for a specific task in the medical field and the analysis of the limitations of the fine-tuning process. The study also identified important limitations, such as data quality and potential bias among the evaluators, which may have influenced the results. As future work, the intention is to conduct longer training sessions, expand and diversify the dataset, and explore new machine learning approaches to further improve the model’s performance.	pt_BR
dc.language.iso	pt_BR	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.title	Desenvolvimento de um Largue Language Model: uma estratégia de aprimoramento de transcrições de anamneses médicas	pt_BR
dc.type	TCC	pt_BR
dc.contributor.co-advisor	Silva, Ticiana Linhares Coelho da	-
dc.description.abstract-ptbr	Este trabalho tem como objetivo explorar o desenvolvimento de um Large Language Model (LLM) para aprimorar transcrições de anamneses médicas. A pesquisa envolveu duas etapas principais: a primeira consistiu em um benchmark inicial de três modelos de linguagem (Phi3, Llama e Mistral), avaliando seu desempenho na tarefa de formatação de anamneses, e a segunda focou na aplicação de fine-tuning no modelo Mistral, com base em críticas qualitativas e quantitativas dos avaliadores. O modelo Mistral se destacou no benchmark devido à sua consistência e melhores resultados nas métricas de concordância, como os coeficientes de Kendall e Kappa, embora tenha sido criticado pela sobrecarga de detalhes em suas respostas, prejudicando sua objetividade. O modelo Llama apresentou o pior desempenho, com respostas frequentemente irrelevantes, enquanto o Phi3 teve um desempenho moderado, mas com falhas em precisão e uso excessivo de linguagem genérica. O fine-tuning aplicado ao modelo Mistral, apesar de tentar corrigir as falhas, não resultou em melhorias significativas, já que a média das avaliações foi ligeiramente inferior à do modelo original. As principais contribuições deste trabalho incluem a comparação de modelos de linguagem para uma tarefa específica da área médica e a análise das limitações do processo de fine-tuning. O estudo também identificou limitações importantes, como a qualidade dos dados e o viés potencial entre os avaliadores, que podem ter influenciado os resultados. Como trabalhos futuros, pretende-se realizar treinamentos mais longos, expandir e diversificar o conjunto de dados e explorar novas abordagens de aprendizado de máquina para melhorar ainda mais o desempenho do modelo.	pt_BR
dc.title.en	Development of a Large Language Model: a strategy for improving medical history transcriptions	pt_BR
dc.subject.ptbr	Modelos Grandes de Linguagem (LLMs)	pt_BR
dc.subject.ptbr	Anamnese médica	pt_BR
dc.subject.ptbr	Text Style Transfer (TST)	pt_BR
dc.subject.ptbr	Aprendizado de máquina	pt_BR
dc.subject.en	Large Language Models (LLMs)	pt_BR
dc.subject.en	Patient records	pt_BR
dc.subject.en	Text Style Transfer (TST)	pt_BR
dc.subject.en	Machine learning	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
local.author.lattes	https://lattes.cnpq.br/4596665817819063	pt_BR
local.advisor.lattes	https://lattes.cnpq.br/3102406452063651	pt_BR
local.co-advisor.lattes	https://lattes.cnpq.br/3125027229507836	pt_BR
local.date.available	2026-03-05	-
Aparece nas coleções:	SISTEMAS E MÍDIAS DIGITAIS - Monografias

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2024_tcc_ytgoncalves.pdf		1,59 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas