Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/84651| Tipo: | TCC |
| Título: | Comparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thought |
| Autor(es): | Santiago Neto, José Valdir |
| Orientador: | Pinheiro, Pedro Helton Magalhães |
| Palavras-chave em português: | engenharia de prompts;modelos de linguagem;zero-shot;few-shot;classificação de sentimentos |
| Palavras-chave em inglês: | prompt engineering;large language models;zero-shot;few-shot;sentiment classification. |
| CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Data do documento: | 2026 |
| Citação: | SANTIAGO NETO, José Valdir. Comparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thought. 2026. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Campus de Russas, Universidade Federal do Ceará, Russas, 2026. |
| Resumo: | A área de Processamento de Linguagem Natural (PLN) foi profundamente impactada pelo surgimento dos Grandes Modelos de Linguagem (LLMs), que introduziram o paradigma de aprendizado no contexto (in-context learning). Essa abordagem permite realizar tarefas complexas via instruções (prompts), reduzindo a necessidade de treinamento supervisionado tradicional. No entanto, para tarefas específicas em português, ainda há dúvidas sobre quando essas novas estratégias justificam seu custo computacional frente a métodos clássicos já consolidados. Este trabalho investiga esse cenário ao comparar empiricamente diferentes estratégias de prompting — incluindo zero-shot (via inferência textual e embeddings), few-shot e Chain-of-Thought (CoT) — na tarefa de classificação de sentimentos. Utilizando um conjunto de dados sintético e balanceado, o estudo avaliou não apenas a eficácia (Macro-F1), mas também a latência em CPU, contrastando os LLMs com um baseline supervisionado (TF-IDF + SVM). Os resultados indicam que, em dados com pistas léxicas claras, as técnicas clássicas ainda oferecem desempenho superior e máxima eficiência. Entre as abordagens sem supervisão, o uso de inferência em linguagem natural (NLI) mostrou-se a alternativa mais robusta em qualidade, enquanto a estratégia baseada em embeddings destacou-se pela velocidade. As abordagens gerativas few-shot, por sua vez, revelaram desafios de estabilidade na adesão aos rótulos rígidos. Conclui-se que a adoção de LLMs deve ser criteriosa, ponderando a disponibilidade de dados rotulados e as restrições de infraestrutura. |
| Abstract: | The field of Natural Language Processing (NLP) has been profoundly impacted by the emergence of Large Language Models (LLMs), which introduced the in-context learning paradigm. This approach allows for performing complex tasks via prompts, reducing the need for traditional supervised training. However, for specific tasks in Portuguese, questions remain regarding when these new strategies justify their computational cost compared to established classical methods. This work investigates this scenario by empirically comparing different prompting strategies — including zero-shot (via textual inference and embeddings), few-shot, and Chain-of-Thought (CoT) — in the sentiment classification task. Using a balanced synthetic dataset, the study evaluated not only efficacy (Macro-F1) but also CPU latency, benchmarking LLMs against a supervised baseline (TF-IDF + SVM). Results indicate that, for data with clear lexical cues, classical techniques still offer superior performance and maximum efficiency. Among unsupervised approaches, the use of Natural Language Inference (NLI) proved to be the most robust alternative in terms of quality, while the embeddings-based strategy stood out for its speed. Generative few-shot approaches, in turn, revealed stability challenges in adhering to rigid labels. It is concluded that the adoption of LLMs must be judicious, weighing the availability of labeled data against infrastructure constraints. |
| URI: | http://repositorio.ufc.br/handle/riufc/84651 |
| Tipo de Acesso: | Acesso Aberto |
| Aparece nas coleções: | CIÊNCIA DA COMPUTAÇÃO - RUSSAS - Monografias |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| 2026_tcc_jvsneto.pdf | 727,79 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.