Comparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thought

Santiago Neto, José Valdir

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/84651

Tipo:	TCC
Título:	Comparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thought
Autor(es):	Santiago Neto, José Valdir
Orientador:	Pinheiro, Pedro Helton Magalhães
Palavras-chave em português:	engenharia de prompts;modelos de linguagem;zero-shot;few-shot;classificação de sentimentos
Palavras-chave em inglês:	prompt engineering;large language models;zero-shot;few-shot;sentiment classification.
CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Data do documento:	2026
Citação:	SANTIAGO NETO, José Valdir. Comparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thought. 2026. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Campus de Russas, Universidade Federal do Ceará, Russas, 2026.
Resumo:	A área de Processamento de Linguagem Natural (PLN) foi profundamente impactada pelo surgimento dos Grandes Modelos de Linguagem (LLMs), que introduziram o paradigma de aprendizado no contexto (in-context learning). Essa abordagem permite realizar tarefas complexas via instruções (prompts), reduzindo a necessidade de treinamento supervisionado tradicional. No entanto, para tarefas específicas em português, ainda há dúvidas sobre quando essas novas estratégias justificam seu custo computacional frente a métodos clássicos já consolidados. Este trabalho investiga esse cenário ao comparar empiricamente diferentes estratégias de prompting — incluindo zero-shot (via inferência textual e embeddings), few-shot e Chain-of-Thought (CoT) — na tarefa de classificação de sentimentos. Utilizando um conjunto de dados sintético e balanceado, o estudo avaliou não apenas a eficácia (Macro-F1), mas também a latência em CPU, contrastando os LLMs com um baseline supervisionado (TF-IDF + SVM). Os resultados indicam que, em dados com pistas léxicas claras, as técnicas clássicas ainda oferecem desempenho superior e máxima eficiência. Entre as abordagens sem supervisão, o uso de inferência em linguagem natural (NLI) mostrou-se a alternativa mais robusta em qualidade, enquanto a estratégia baseada em embeddings destacou-se pela velocidade. As abordagens gerativas few-shot, por sua vez, revelaram desafios de estabilidade na adesão aos rótulos rígidos. Conclui-se que a adoção de LLMs deve ser criteriosa, ponderando a disponibilidade de dados rotulados e as restrições de infraestrutura.
Abstract:	The field of Natural Language Processing (NLP) has been profoundly impacted by the emergence of Large Language Models (LLMs), which introduced the in-context learning paradigm. This approach allows for performing complex tasks via prompts, reducing the need for traditional supervised training. However, for specific tasks in Portuguese, questions remain regarding when these new strategies justify their computational cost compared to established classical methods. This work investigates this scenario by empirically comparing different prompting strategies — including zero-shot (via textual inference and embeddings), few-shot, and Chain-of-Thought (CoT) — in the sentiment classification task. Using a balanced synthetic dataset, the study evaluated not only efficacy (Macro-F1) but also CPU latency, benchmarking LLMs against a supervised baseline (TF-IDF + SVM). Results indicate that, for data with clear lexical cues, classical techniques still offer superior performance and maximum efficiency. Among unsupervised approaches, the use of Natural Language Inference (NLI) proved to be the most robust alternative in terms of quality, while the embeddings-based strategy stood out for its speed. Generative few-shot approaches, in turn, revealed stability challenges in adhering to rigid labels. It is concluded that the adoption of LLMs must be judicious, weighing the availability of labeled data against infrastructure constraints.
URI:	http://repositorio.ufc.br/handle/riufc/84651
Tipo de Acesso:	Acesso Aberto
Aparece nas coleções:	CIÊNCIA DA COMPUTAÇÃO - RUSSAS - Monografias

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2026_tcc_jvsneto.pdf		727,79 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas