Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/80668
Tipo: TCC
Título: Classificação automática de marcas utilizando algoritmos de aprendizado de máquina
Autor(es): Pompeu, Ian Mateus Torres
Orientador: Cruz, Lívia Almada
Palavras-chave em português: classificação de marcas;aprendizado de máquina;processamento de linguagem natural
CNPq: CNPQ: CIÊNCIAS EXATAS E DA TERRA
Data do documento: 2025
Citação: POMPEU, Ian Mateus Torres. Classificação automática de marcas utilizando algoritmos de aprendizado de máquina. 2025. 55 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Software)- Campus de Quixadá, Universidade Federal do Ceará, Quixadá, 2025.
Resumo: Este trabalho apresenta o desenvolvimento de um classificador automático de marcas utilizando algoritmos de aprendizado de máquina, com o objetivo de identificar marcas de produtos a partir de descrições textuais. A categorização automática de produtos é um desafio significativo no setor de varejo e ERP devido ao grande volume de dados textuais não estruturados. Utilizando técnicas de Processamento de Linguagem Natural (PLN) e representações textuais como Bag of Words (BoW), TF-IDF, Word2Vec e FastText, o estudo aplicou modelos como Regressão Logística, Floresta Aleatória, Naive Bayes e SVM para classificar as marcas. O conjunto de dados utilizado inclui 517.262 descrições de produtos, categorizados em 1.964 marcas distintas. Os resultados experimentais indicam que as combinações de BoW e TF-IDF com os modelos de Regressão Logística e SVM apresentaram os melhores desempenhos, atingindo uma acurácia de 94%. Por outro lado, técnicas como Word2Vec apresentaram desempenho inferior, sugerindo que vetorizadores baseados em contagem continuam sendo mais eficientes para este tipo de tarefa. O estudo conclui que a classificação automática de marcas pode ser significativamente aprimorada com a aplicação de modelos supervisionados, e recomenda o uso de representações mais sofisticadas para futuras melhorias.
Abstract: This work presents the development of an automatic brand classifier using machine learning algorithms, with the objective of identifying product brands based on textual descriptions. Automatic product categorization is a significant challenge in the retail and ERP sectors due to the large volume of unstructured textual data. By utilizing Natural Language Processing (NLP) techniques and textual representations such as Bag of Words (BoW), TF-IDF, Word2Vec, and FastText, the study applied models like Logistic Regression, Random Forest, Naive Bayes, and SVM to classify the brands. The dataset used includes 517,262 product descriptions, categorized into 1,964 distinct brands. Experimental results indicate that the combinations of BoW and TF-IDF with Logistic Regression and SVM models achieved the best performance, reaching an accuracy of 94%. On the other hand, techniques like Word2Vec showed inferior performance, suggesting that count-based vectorizers remain more efficient for this type of task. The study concludes that automatic brand classification can be significantly improved with the application of supervised models and recommends the use of more sophisticated representations for future enhancements.
URI: http://repositorio.ufc.br/handle/riufc/80668
Currículo Lattes do Orientador: http://lattes.cnpq.br/8972397134674530
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:ENGENHARIA DE SOFTWARE - QUIXADÁ - TCC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2025_tcc_imtpompeu.pdf840,83 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.