Avaliando o desempenho de grandes modelos de linguagem na realização de provas de dedução natural em lógica proposicional e lógica de predicados

Martins, Francisco Leonardo Batista

Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/86151

Tipo:	Dissertação
Título :	Avaliando o desempenho de grandes modelos de linguagem na realização de provas de dedução natural em lógica proposicional e lógica de predicados
Autor :	Martins, Francisco Leonardo Batista
Tutor:	Vasconcelos, Davi Romero de
Co-asesor:	Menezes, Maria Viviane de
Palabras clave en portugués brasileño:	dedução natural;lógica proposicional;lógica de predicados;raciocínio lógico;grandes modelos de linguagem
Áreas de Conocimiento - CNPq:	CNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Fecha de publicación :	2025
Citación :	MARTINS, Francisco Leonardo Batista. Avaliando o desempenho de grandes modelos de linguagem na realização de provas de dedução natural em lógica proposicional e lógica de predicados. 2025. 82 f. Dissertação (Mestrado em Computação) - Campus de Quixadá, Programa de Pós-Graduação em Computação, Universidade Federal do Ceará, Quixadá, 2025.
Resumen en portugués brasileño:	A crescente utilização de agentes conversacionais tem despertado um interesse cada vez maior entre pesquisadores, educadores e instituições de ensino em todo o mundo. Além disso, com a recente popularização dos Grandes Modelos de Linguagem (do inglês Large Language Models- LLMs), muitos estudos têm sido conduzidos no sentido de explorar a utilização dessas ferramentas para auxiliar no processo de ensino e aprendizagem. Esses sistemas têm a capacidade de compreender e processar enormes quantidades de dados, o que lhes permite, por exemplo, fornecer suporte individualizado aos alunos na resolução de exercícios. Entretanto, é fundamental considerar que tais sistemas, geralmente, possuem um processo de raciocínio baseado em métodos estatísticos, como algoritmos de aprendizado de máquina, os quais podem produzir respostas incorretas em tarefas que exigem raciocínio lógico. Este trabalho tem como objetivo avaliar a habilidade de Grandes Modelos de Linguagem , na resolução de exercícios de Dedução Natural em Lógica Proposicional e Lógica de Predicados. Para tanto, foram realizados experimentos utilizando os modelos GPT 4.1-mini, GPT 4o e GPT 3.5-turbo na resolução de exercícios de dedução natural. Esses experimentos foram conduzidos, a priori, sem treinamento e, posteriormente, foram realizados os experimentos no modelo GPT 4.1-mini treinado, a fim de verificar eventuais melhorias de desempenho. Os resultados apontam uma melhora significativa após o treinamento, embora o modelo ainda apresente um número considerável de erros. Portanto, caso seja empregado para essa tarefa, recomenda-se o uso com a devida prudência.
Abstract:	The growing use of conversational agents has sparked increasing interest among researchers, educators, and educational institutions worldwide. Moreover, with the recent popularization of Large Language Models (LLMs), numerous studies have been conducted to explore the use of these tools to support the teaching and learning process. These systems are capable of understanding and processing vast amounts of data, which allows them, for example, to provide individualized support to students in solving exercises. However, it is essential to consider that such systems generally employ reasoning processes based on statistical methods, such as machine learning algorithms, which may produce incorrect answers in tasks requiring logical reasoning. This study aims to evaluate the ability of Large Language Models (LLMs) to solve Natural Deduction exercises in Propositional Logic and Predicate Logic. To this end, experiments were carried out using the GPT 4.1-mini, GPT 4o, and GPT 3.5turbo models to solve natural deduction exercises. These experiments were conducted a priori, without training, and subsequently, further experiments were performed on the trained GPT 4.1-mini model to assess potential performance improvements. The results indicate a significant improvement after training, although the model still exhibits a considerable number of errors. Therefore, if employed for this task, its use is recommended with due caution.
URI :	http://repositorio.ufc.br/handle/riufc/86151
Lattes del autor:	http://lattes.cnpq.br/3475281083552193
Lattes del tutor:	http://lattes.cnpq.br/4141708952523045
Lattes del co-asesor:	http://lattes.cnpq.br/2028071357762491
Derechos de acceso:	Acesso Aberto
Aparece en las colecciones:	PCOMP - QUIXADÁ - Dissertações defendidas na UFC

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
2025_dis_flbmartins.pdf		894,46 kB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem