Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.ufc.br/handle/riufc/86151| Tipo: | Dissertação |
| Título : | Avaliando o desempenho de grandes modelos de linguagem na realização de provas de dedução natural em lógica proposicional e lógica de predicados |
| Autor : | Martins, Francisco Leonardo Batista |
| Tutor: | Vasconcelos, Davi Romero de |
| Co-asesor: | Menezes, Maria Viviane de |
| Palabras clave en portugués brasileño: | dedução natural;lógica proposicional;lógica de predicados;raciocínio lógico;grandes modelos de linguagem |
| Áreas de Conocimiento - CNPq: | CNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
| Fecha de publicación : | 2025 |
| Citación : | MARTINS, Francisco Leonardo Batista. Avaliando o desempenho de grandes modelos de linguagem na realização de provas de dedução natural em lógica proposicional e lógica de predicados. 2025. 82 f. Dissertação (Mestrado em Computação) - Campus de Quixadá, Programa de Pós-Graduação em Computação, Universidade Federal do Ceará, Quixadá, 2025. |
| Resumen en portugués brasileño: | A crescente utilização de agentes conversacionais tem despertado um interesse cada vez maior entre pesquisadores, educadores e instituições de ensino em todo o mundo. Além disso, com a recente popularização dos Grandes Modelos de Linguagem (do inglês Large Language Models- LLMs), muitos estudos têm sido conduzidos no sentido de explorar a utilização dessas ferramentas para auxiliar no processo de ensino e aprendizagem. Esses sistemas têm a capacidade de compreender e processar enormes quantidades de dados, o que lhes permite, por exemplo, fornecer suporte individualizado aos alunos na resolução de exercícios. Entretanto, é fundamental considerar que tais sistemas, geralmente, possuem um processo de raciocínio baseado em métodos estatísticos, como algoritmos de aprendizado de máquina, os quais podem produzir respostas incorretas em tarefas que exigem raciocínio lógico. Este trabalho tem como objetivo avaliar a habilidade de Grandes Modelos de Linguagem , na resolução de exercícios de Dedução Natural em Lógica Proposicional e Lógica de Predicados. Para tanto, foram realizados experimentos utilizando os modelos GPT 4.1-mini, GPT 4o e GPT 3.5-turbo na resolução de exercícios de dedução natural. Esses experimentos foram conduzidos, a priori, sem treinamento e, posteriormente, foram realizados os experimentos no modelo GPT 4.1-mini treinado, a fim de verificar eventuais melhorias de desempenho. Os resultados apontam uma melhora significativa após o treinamento, embora o modelo ainda apresente um número considerável de erros. Portanto, caso seja empregado para essa tarefa, recomenda-se o uso com a devida prudência. |
| Abstract: | The growing use of conversational agents has sparked increasing interest among researchers, educators, and educational institutions worldwide. Moreover, with the recent popularization of Large Language Models (LLMs), numerous studies have been conducted to explore the use of these tools to support the teaching and learning process. These systems are capable of understanding and processing vast amounts of data, which allows them, for example, to provide individualized support to students in solving exercises. However, it is essential to consider that such systems generally employ reasoning processes based on statistical methods, such as machine learning algorithms, which may produce incorrect answers in tasks requiring logical reasoning. This study aims to evaluate the ability of Large Language Models (LLMs) to solve Natural Deduction exercises in Propositional Logic and Predicate Logic. To this end, experiments were carried out using the GPT 4.1-mini, GPT 4o, and GPT 3.5turbo models to solve natural deduction exercises. These experiments were conducted a priori, without training, and subsequently, further experiments were performed on the trained GPT 4.1-mini model to assess potential performance improvements. The results indicate a significant improvement after training, although the model still exhibits a considerable number of errors. Therefore, if employed for this task, its use is recommended with due caution. |
| URI : | http://repositorio.ufc.br/handle/riufc/86151 |
| Lattes del autor: | http://lattes.cnpq.br/3475281083552193 |
| Lattes del tutor: | http://lattes.cnpq.br/4141708952523045 |
| Lattes del co-asesor: | http://lattes.cnpq.br/2028071357762491 |
| Derechos de acceso: | Acesso Aberto |
| Aparece en las colecciones: | PCOMP - QUIXADÁ - Dissertações defendidas na UFC |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| 2025_dis_flbmartins.pdf | 894,46 kB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.