Investigando estratégias de engenharia de prompt para melhorar a qualidade de requisitos gerados por LLMs

Mendes, Gabriel de Souza

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/85743

Tipo:	TCC
Título:	Investigando estratégias de engenharia de prompt para melhorar a qualidade de requisitos gerados por LLMs
Autor(es):	Mendes, Gabriel de Souza
Orientador:	Bezerra, Carla Ilane Moreira
Palavras-chave em português:	engenharia de requisitos;large language models;engenharia de prompt;qualidade de software
CNPq:	CNPQ: CIÊNCIAS EXATAS E DA TERRA: ENGENHARIA DE SOFTWARE
Data do documento:	2026
Citação:	MENDES, Gabriel de Souza. Investigando estratégias de engenharia de prompt para melhorar a qualidade de requisitos gerados por LLMs. 2026. 63 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Software) - Campus de Quixadá, Universidade Federal do Ceará, Quixadá, 2026.
Resumo:	A qualidade dos requisitos de software é um fator determinante para o sucesso de projetos, visto que falhas de especificação geram altos custos de retrabalho e inconsistências no produto final. Os Large Language Models (LLMs) têm sido explorados para auxiliar na elicitação e documentação de requisitos, embora ainda apresentem limitações quanto à precisão de regras de negócio e alucinações. Este estudo investiga empiricamente o impacto de diferentes estratégias de Engenharia de Prompt (Input Only, Chain of Thought e Tree of Thought), na qualidade de requisitos funcionais gerados pelos modelos GPT-5, Gemini 3 e DeepSeek-R1. A metodologia adotou uma abordagem híbrida, combinando uma análise quantitativa da completude estrutural (ator, ação, objeto e condição) com uma avaliação qualitativa baseada em clareza, completude, consistência e relevância, finalizando com uma validação prática junto a stakeholders. Os resultados indicam que, embora os modelos apresentem alto desempenho em atributos básicos, a especificação de Condições representa o maior desafio, registrando taxas de presença inferiores a 60% na estratégia Input Only. A combinação do modelo GPT-5 com a técnica Chain of Thought produziu os requisitos com a maior qualidade geral, atingindo médias superiores a 4,90 nos critérios citados na análise qualitativa. Entretanto, a validação com especialistas revelou que apenas 33% dos requisitos gerados foram plenamente aceitos sem restrições, sendo a Omissão de informações o defeito mais prevalente (50%). Além disso, observou-se uma forte correlação positiva entre a completude estrutural das condições e a percepção humana de qualidade. Concluise que o uso de estratégias avançadas de raciocínio é essencial para mitigar deficiências dos LLMs, servindo como uma base sólida para a engenharia de requisitos, mas não elimina a necessidade de revisão humana especializada.
Abstract:	The quality of software requirements is a determining factor for the success of projects, since specification failures generate high rework costs and inconsistencies in the final product. Large Language Models (LLMs) have been explored to support requirements elicitation and documentation; however, they still present limitations regarding the accuracy of business rules and hallucinations. This study empirically investigates the impact of different Prompt Engineering strategies (Input Only, Chain of Thought, and Tree of Thought) on the quality of functional requirements generated by the GPT-5, Gemini 3, and DeepSeek-R1 models. The adopted methodology followed a hybrid approach, combining a quantitative analysis of structural completeness (actor, action, object, and condition) with a qualitative evaluation based on clarity, completeness, consistency, and relevance, concluding with practical validation involving stakeholders. The results indicate that, although the models demonstrate high performance in basic attributes, the specification of Conditions represents the greatest challenge, with presence rates below 60% under the Input Only strategy. The combination of the GPT-5 model with the Chain of Thought technique produced the highest overall quality requirements, achieving average scores above 4.90 in the criteria considered in the qualitative analysis. However, validation with experts revealed that only 33% of the generated requirements were fully accepted without restrictions, with Information Omission being the most prevalent defect (50%). Furthermore, a strong positive correlation was observed between the structural completeness of conditions and the human perception of quality. It is concluded that the use of advanced reasoning strategies is essential to mitigate LLM deficiencies, serving as a solid foundation for requirements engineering; however, it does not eliminate the need for specialized human review.
URI:	http://repositorio.ufc.br/handle/riufc/85743
Currículo Lattes do Orientador:	http://lattes.cnpq.br/4277471687235814
Tipo de Acesso:	Acesso Aberto
Aparece nas coleções:	ENGENHARIA DE SOFTWARE - QUIXADÁ - TCC

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2026_tcc_gsmendes.pdf		1,89 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas