Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/84651
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorPinheiro, Pedro Helton Magalhães-
dc.contributor.authorSantiago Neto, José Valdir-
dc.date.accessioned2026-02-09T11:55:17Z-
dc.date.available2026-02-09T11:55:17Z-
dc.date.issued2026-
dc.identifier.citationSANTIAGO NETO, José Valdir. Comparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thought. 2026. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Campus de Russas, Universidade Federal do Ceará, Russas, 2026.pt_BR
dc.identifier.urihttp://repositorio.ufc.br/handle/riufc/84651-
dc.description.abstractThe field of Natural Language Processing (NLP) has been profoundly impacted by the emergence of Large Language Models (LLMs), which introduced the in-context learning paradigm. This approach allows for performing complex tasks via prompts, reducing the need for traditional supervised training. However, for specific tasks in Portuguese, questions remain regarding when these new strategies justify their computational cost compared to established classical methods. This work investigates this scenario by empirically comparing different prompting strategies — including zero-shot (via textual inference and embeddings), few-shot, and Chain-of-Thought (CoT) — in the sentiment classification task. Using a balanced synthetic dataset, the study evaluated not only efficacy (Macro-F1) but also CPU latency, benchmarking LLMs against a supervised baseline (TF-IDF + SVM). Results indicate that, for data with clear lexical cues, classical techniques still offer superior performance and maximum efficiency. Among unsupervised approaches, the use of Natural Language Inference (NLI) proved to be the most robust alternative in terms of quality, while the embeddings-based strategy stood out for its speed. Generative few-shot approaches, in turn, revealed stability challenges in adhering to rigid labels. It is concluded that the adoption of LLMs must be judicious, weighing the availability of labeled data against infrastructure constraints.pt_BR
dc.language.isopt_BRpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleComparação de estratégias de prompting em LLMS para classificação de texto em português: um estudo empírico entre zero-shot, few-shot e chain-of-thoughtpt_BR
dc.typeTCCpt_BR
dc.description.abstract-ptbrA área de Processamento de Linguagem Natural (PLN) foi profundamente impactada pelo surgimento dos Grandes Modelos de Linguagem (LLMs), que introduziram o paradigma de aprendizado no contexto (in-context learning). Essa abordagem permite realizar tarefas complexas via instruções (prompts), reduzindo a necessidade de treinamento supervisionado tradicional. No entanto, para tarefas específicas em português, ainda há dúvidas sobre quando essas novas estratégias justificam seu custo computacional frente a métodos clássicos já consolidados. Este trabalho investiga esse cenário ao comparar empiricamente diferentes estratégias de prompting — incluindo zero-shot (via inferência textual e embeddings), few-shot e Chain-of-Thought (CoT) — na tarefa de classificação de sentimentos. Utilizando um conjunto de dados sintético e balanceado, o estudo avaliou não apenas a eficácia (Macro-F1), mas também a latência em CPU, contrastando os LLMs com um baseline supervisionado (TF-IDF + SVM). Os resultados indicam que, em dados com pistas léxicas claras, as técnicas clássicas ainda oferecem desempenho superior e máxima eficiência. Entre as abordagens sem supervisão, o uso de inferência em linguagem natural (NLI) mostrou-se a alternativa mais robusta em qualidade, enquanto a estratégia baseada em embeddings destacou-se pela velocidade. As abordagens gerativas few-shot, por sua vez, revelaram desafios de estabilidade na adesão aos rótulos rígidos. Conclui-se que a adoção de LLMs deve ser criteriosa, ponderando a disponibilidade de dados rotulados e as restrições de infraestrutura.pt_BR
dc.subject.ptbrengenharia de promptspt_BR
dc.subject.ptbrmodelos de linguagempt_BR
dc.subject.ptbrzero-shotpt_BR
dc.subject.ptbrfew-shotpt_BR
dc.subject.ptbrclassificação de sentimentospt_BR
dc.subject.enprompt engineeringpt_BR
dc.subject.enlarge language modelspt_BR
dc.subject.enzero-shotpt_BR
dc.subject.enfew-shotpt_BR
dc.subject.ensentiment classification.pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
local.date.available2026-
Aparece nas coleções:CIÊNCIA DA COMPUTAÇÃO - RUSSAS - Monografias

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2026_tcc_jvsneto.pdf727,79 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.