O uso da geração aumentada por recuperação na validação da extração de argumentos de documentos jurídicos

Castro, Rubens Cauan Figueredo de

Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/82854

Type:	TCC
Title:	O uso da geração aumentada por recuperação na validação da extração de argumentos de documentos jurídicos
Authors:	Castro, Rubens Cauan Figueredo de
Advisor:	Magalhães, Regis Pires
Keywords in Brazilian Portuguese :	modelos de linguagem;validação;documentos jurídicos;similaridade
Knowledge Areas - CNPq:	CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO: METODOLOGIA E TÉCNICAS DA COMPUTAÇÃO: SISTEMAS DE INFORMAÇÃO
Issue Date:	2025
Citation:	CASTRO, Rubens Cauan Figueredo de. O uso da geração aumentada por recuperação na validação da extração de argumentos de documentos jurídicos. 2025. 59 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) - Campus de Quixadá, Universidade Federal do Ceará, Quixadá, 2025.
Abstract in Brazilian Portuguese:	Grandes Modelos de Linguagem (LLMs) representam uma tecnologia transformadora em diversas áreas, incluindo o setor jurídico. No entanto, a propensão desses modelos a gerar informações não factuais, conhecidas como "alucinações", impõe um risco significativo à sua aplicação em contextos que demandam alta precisão. Este trabalho propõe e avalia uma estratégia que adapta a arquitetura de Geração Aumentada por Recuperação (RAG) como um mecanismo para validar argumentos extraídos de documentos jurídicos. O objetivo principal é extrair argumentos de peças de defesa e, em seguida, validá-los ao confrontá-los com os trechos mais similares do próprio documento fonte, aumentando a confiabilidade do processo. A metodologia incluiu uma análise comparativa entre modelos de código aberto e proprietários, e o desenvolvimento de um sistema que fornece rastreabilidade explícita para cada argumento gerado. Os resultados indicam que a validação é crucial, e que a abordagem proposta aumenta a confiança na ferramenta, permitindo que até mesmo modelos gratuitos alcancem um desempenho robusto. Conclui-se que a integração eficaz de IA no direito depende de sistemas híbridos que aliem a automação à supervisão humana qualificada.
Abstract:	Large Language Models (LLMs)represent a transformative technology in several areas, including the legal sector. However, the propensity of these models to generate non-factual information, known as "hallucinations,"poses a significant risk to their application in contexts that demand high precision. This work proposes and evaluates a strategy that adapts the Retrieval-Augmented Generation (RAG) architecture as a mechanism to validate arguments extracted from legal documents. The main objective is to extract arguments from defense briefs and then validate them by cross-referencing them with the most similar excerpts from the source document itself, thereby increasing the process’s reliability. The methodology included a comparative analysis between open-source and proprietary models, and the development of a system that provides explicit traceability for each generated argument. The results indicate that validation is crucial and that the proposed approach increases confidence in the tool, allowing even free models to achieve robust performance. It is concluded that the effective integration of AI in law depends on hybrid systems that combine automation with qualified human supervision.
URI:	http://repositorio.ufc.br/handle/riufc/82854
Advisor's Lattes:	http://lattes.cnpq.br/7195981513707548
Access Rights:	Acesso Aberto
Appears in Collections:	SISTEMAS DE INFORMAÇÃO - QUIXADÁ - TCC

Files in This Item:

File	Description	Size	Format
2025_tcc_rcfcastro.pdf		1,08 MB	Adobe PDF	View/Open

Show full item record