Comparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thought

Santiago Neto, José Valdir

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/84651

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Pinheiro, Pedro Helton Magalhães	-
dc.contributor.author	Santiago Neto, José Valdir	-
dc.date.accessioned	2026-02-09T11:55:17Z	-
dc.date.available	2026-02-09T11:55:17Z	-
dc.date.issued	2026	-
dc.identifier.citation	SANTIAGO NETO, José Valdir. Comparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thought. 2026. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Campus de Russas, Universidade Federal do Ceará, Russas, 2026.	pt_BR
dc.identifier.uri	http://repositorio.ufc.br/handle/riufc/84651	-
dc.description.abstract	The field of Natural Language Processing (NLP) has been profoundly impacted by the emergence of Large Language Models (LLMs), which introduced the in-context learning paradigm. This approach allows for performing complex tasks via prompts, reducing the need for traditional supervised training. However, for specific tasks in Portuguese, questions remain regarding when these new strategies justify their computational cost compared to established classical methods. This work investigates this scenario by empirically comparing different prompting strategies — including zero-shot (via textual inference and embeddings), few-shot, and Chain-of-Thought (CoT) — in the sentiment classification task. Using a balanced synthetic dataset, the study evaluated not only efficacy (Macro-F1) but also CPU latency, benchmarking LLMs against a supervised baseline (TF-IDF + SVM). Results indicate that, for data with clear lexical cues, classical techniques still offer superior performance and maximum efficiency. Among unsupervised approaches, the use of Natural Language Inference (NLI) proved to be the most robust alternative in terms of quality, while the embeddings-based strategy stood out for its speed. Generative few-shot approaches, in turn, revealed stability challenges in adhering to rigid labels. It is concluded that the adoption of LLMs must be judicious, weighing the availability of labeled data against infrastructure constraints.	pt_BR
dc.language.iso	pt_BR	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.title	Comparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thought	pt_BR
dc.type	TCC	pt_BR
dc.description.abstract-ptbr	A área de Processamento de Linguagem Natural (PLN) foi profundamente impactada pelo surgimento dos Grandes Modelos de Linguagem (LLMs), que introduziram o paradigma de aprendizado no contexto (in-context learning). Essa abordagem permite realizar tarefas complexas via instruções (prompts), reduzindo a necessidade de treinamento supervisionado tradicional. No entanto, para tarefas específicas em português, ainda há dúvidas sobre quando essas novas estratégias justificam seu custo computacional frente a métodos clássicos já consolidados. Este trabalho investiga esse cenário ao comparar empiricamente diferentes estratégias de prompting — incluindo zero-shot (via inferência textual e embeddings), few-shot e Chain-of-Thought (CoT) — na tarefa de classificação de sentimentos. Utilizando um conjunto de dados sintético e balanceado, o estudo avaliou não apenas a eficácia (Macro-F1), mas também a latência em CPU, contrastando os LLMs com um baseline supervisionado (TF-IDF + SVM). Os resultados indicam que, em dados com pistas léxicas claras, as técnicas clássicas ainda oferecem desempenho superior e máxima eficiência. Entre as abordagens sem supervisão, o uso de inferência em linguagem natural (NLI) mostrou-se a alternativa mais robusta em qualidade, enquanto a estratégia baseada em embeddings destacou-se pela velocidade. As abordagens gerativas few-shot, por sua vez, revelaram desafios de estabilidade na adesão aos rótulos rígidos. Conclui-se que a adoção de LLMs deve ser criteriosa, ponderando a disponibilidade de dados rotulados e as restrições de infraestrutura.	pt_BR
dc.subject.ptbr	engenharia de prompts	pt_BR
dc.subject.ptbr	modelos de linguagem	pt_BR
dc.subject.ptbr	zero-shot	pt_BR
dc.subject.ptbr	few-shot	pt_BR
dc.subject.ptbr	classificação de sentimentos	pt_BR
dc.subject.en	prompt engineering	pt_BR
dc.subject.en	large language models	pt_BR
dc.subject.en	zero-shot	pt_BR
dc.subject.en	few-shot	pt_BR
dc.subject.en	sentiment classification.	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
local.date.available	2026	-
Aparece nas coleções:	CIÊNCIA DA COMPUTAÇÃO - RUSSAS - Monografias

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2026_tcc_jvsneto.pdf		727,79 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas