Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/85078
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorCarmo, Rafael Augusto Ferreira do-
dc.contributor.authorGonçalves, Yanna Torres-
dc.date.accessioned2026-03-05T16:05:54Z-
dc.date.available2026-03-05T16:05:54Z-
dc.date.issued2024-
dc.identifier.citationGONÇALVES, Yanna Torres. Desenvolvimento de um Largue Language Model: uma estratégia de aprimoramento de transcrições de anamneses médicas. 2026. 52 f. Trabalho de Conclusão de Curso (Graduação em Sistemas e Mídias Digitais) – Instituto UFC Virtual, Universidade Federal do Ceará, Fortaleza, 2024.pt_BR
dc.identifier.urihttp://repositorio.ufc.br/handle/riufc/85078-
dc.description.abstractThis work aims to explore the development of a Large Language Model (LLM) to enhance the transcription of patient records. The research involved two main stages: the first consisted of an initial benchmark of three language models (Phi3, Llama, and Mistral), evaluating their performance in the task of formatting anamneses, and the second focused on fine-tuning the Mistral model, based on qualitative and quantitative feedback from the evaluators. The Mistral model stood out in the benchmark due to its consistency and better results in agreement metrics, such as Kendall’s tau and Fleiss’ Kappa coefficients, although it was criticized for overloading details in its responses, impairing its objectivity. The Llama model performed the worst, with responses that were often irrelevant, while Phi3 showed moderate performance, but with issues in precision and excessive use of generic language. The fine-tuning of the Mistral model, despite attempts to correct the flaws, did not result in significant improvements, as the average evaluation score was slightly lower than the original model. The main contributions of this work include the comparison of language models for a specific task in the medical field and the analysis of the limitations of the fine-tuning process. The study also identified important limitations, such as data quality and potential bias among the evaluators, which may have influenced the results. As future work, the intention is to conduct longer training sessions, expand and diversify the dataset, and explore new machine learning approaches to further improve the model’s performance.pt_BR
dc.language.isopt_BRpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleDesenvolvimento de um Largue Language Model: uma estratégia de aprimoramento de transcrições de anamneses médicaspt_BR
dc.typeTCCpt_BR
dc.contributor.co-advisorSilva, Ticiana Linhares Coelho da-
dc.description.abstract-ptbrEste trabalho tem como objetivo explorar o desenvolvimento de um Large Language Model (LLM) para aprimorar transcrições de anamneses médicas. A pesquisa envolveu duas etapas principais: a primeira consistiu em um benchmark inicial de três modelos de linguagem (Phi3, Llama e Mistral), avaliando seu desempenho na tarefa de formatação de anamneses, e a segunda focou na aplicação de fine-tuning no modelo Mistral, com base em críticas qualitativas e quantitativas dos avaliadores. O modelo Mistral se destacou no benchmark devido à sua consistência e melhores resultados nas métricas de concordância, como os coeficientes de Kendall e Kappa, embora tenha sido criticado pela sobrecarga de detalhes em suas respostas, prejudicando sua objetividade. O modelo Llama apresentou o pior desempenho, com respostas frequentemente irrelevantes, enquanto o Phi3 teve um desempenho moderado, mas com falhas em precisão e uso excessivo de linguagem genérica. O fine-tuning aplicado ao modelo Mistral, apesar de tentar corrigir as falhas, não resultou em melhorias significativas, já que a média das avaliações foi ligeiramente inferior à do modelo original. As principais contribuições deste trabalho incluem a comparação de modelos de linguagem para uma tarefa específica da área médica e a análise das limitações do processo de fine-tuning. O estudo também identificou limitações importantes, como a qualidade dos dados e o viés potencial entre os avaliadores, que podem ter influenciado os resultados. Como trabalhos futuros, pretende-se realizar treinamentos mais longos, expandir e diversificar o conjunto de dados e explorar novas abordagens de aprendizado de máquina para melhorar ainda mais o desempenho do modelo.pt_BR
dc.title.enDevelopment of a Large Language Model: a strategy for improving medical history transcriptionspt_BR
dc.subject.ptbrModelos Grandes de Linguagem (LLMs)pt_BR
dc.subject.ptbrAnamnese médicapt_BR
dc.subject.ptbrText Style Transfer (TST)pt_BR
dc.subject.ptbrAprendizado de máquinapt_BR
dc.subject.enLarge Language Models (LLMs)pt_BR
dc.subject.enPatient recordspt_BR
dc.subject.enText Style Transfer (TST)pt_BR
dc.subject.enMachine learningpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
local.author.latteshttps://lattes.cnpq.br/4596665817819063pt_BR
local.advisor.latteshttps://lattes.cnpq.br/3102406452063651pt_BR
local.co-advisor.latteshttps://lattes.cnpq.br/3125027229507836pt_BR
local.date.available2026-03-05-
Aparece nas coleções:SISTEMAS E MÍDIAS DIGITAIS - Monografias

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2024_tcc_ytgoncalves.pdf1,59 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.