Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/82854
Tipo: TCC
Título: O uso da geração aumentada por recuperação na validação da extração de argumentos de documentos jurídicos
Autor(es): Castro, Rubens Cauan Figueredo de
Orientador: Magalhães, Regis Pires
Palavras-chave em português: modelos de linguagem;validação;documentos jurídicos;similaridade
CNPq: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO: METODOLOGIA E TÉCNICAS DA COMPUTAÇÃO: SISTEMAS DE INFORMAÇÃO
Data do documento: 2025
Citação: CASTRO, Rubens Cauan Figueredo de. O uso da geração aumentada por recuperação na validação da extração de argumentos de documentos jurídicos. 2025. 59 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) - Campus de Quixadá, Universidade Federal do Ceará, Quixadá, 2025.
Resumo: Grandes Modelos de Linguagem (LLMs) representam uma tecnologia transformadora em diversas áreas, incluindo o setor jurídico. No entanto, a propensão desses modelos a gerar informações não factuais, conhecidas como "alucinações", impõe um risco significativo à sua aplicação em contextos que demandam alta precisão. Este trabalho propõe e avalia uma estratégia que adapta a arquitetura de Geração Aumentada por Recuperação (RAG) como um mecanismo para validar argumentos extraídos de documentos jurídicos. O objetivo principal é extrair argumentos de peças de defesa e, em seguida, validá-los ao confrontá-los com os trechos mais similares do próprio documento fonte, aumentando a confiabilidade do processo. A metodologia incluiu uma análise comparativa entre modelos de código aberto e proprietários, e o desenvolvimento de um sistema que fornece rastreabilidade explícita para cada argumento gerado. Os resultados indicam que a validação é crucial, e que a abordagem proposta aumenta a confiança na ferramenta, permitindo que até mesmo modelos gratuitos alcancem um desempenho robusto. Conclui-se que a integração eficaz de IA no direito depende de sistemas híbridos que aliem a automação à supervisão humana qualificada.
Abstract: Large Language Models (LLMs)represent a transformative technology in several areas, including the legal sector. However, the propensity of these models to generate non-factual information, known as "hallucinations,"poses a significant risk to their application in contexts that demand high precision. This work proposes and evaluates a strategy that adapts the Retrieval-Augmented Generation (RAG) architecture as a mechanism to validate arguments extracted from legal documents. The main objective is to extract arguments from defense briefs and then validate them by cross-referencing them with the most similar excerpts from the source document itself, thereby increasing the process’s reliability. The methodology included a comparative analysis between open-source and proprietary models, and the development of a system that provides explicit traceability for each generated argument. The results indicate that validation is crucial and that the proposed approach increases confidence in the tool, allowing even free models to achieve robust performance. It is concluded that the effective integration of AI in law depends on hybrid systems that combine automation with qualified human supervision.
URI: http://repositorio.ufc.br/handle/riufc/82854
Currículo Lattes do Orientador: http://lattes.cnpq.br/7195981513707548
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:SISTEMAS DE INFORMAÇÃO - QUIXADÁ - TCC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2025_tcc_rcfcastro.pdf1,08 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.