Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/80668
Type: TCC
Title: Classificação automática de marcas utilizando algoritmos de aprendizado de máquina
Authors: Pompeu, Ian Mateus Torres
Advisor: Cruz, Lívia Almada
Keywords in Brazilian Portuguese : classificação de marcas;aprendizado de máquina;processamento de linguagem natural
Knowledge Areas - CNPq: CNPQ: CIÊNCIAS EXATAS E DA TERRA
Issue Date: 2025
Citation: POMPEU, Ian Mateus Torres. Classificação automática de marcas utilizando algoritmos de aprendizado de máquina. 2025. 55 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Software)- Campus de Quixadá, Universidade Federal do Ceará, Quixadá, 2025.
Abstract in Brazilian Portuguese: Este trabalho apresenta o desenvolvimento de um classificador automático de marcas utilizando algoritmos de aprendizado de máquina, com o objetivo de identificar marcas de produtos a partir de descrições textuais. A categorização automática de produtos é um desafio significativo no setor de varejo e ERP devido ao grande volume de dados textuais não estruturados. Utilizando técnicas de Processamento de Linguagem Natural (PLN) e representações textuais como Bag of Words (BoW), TF-IDF, Word2Vec e FastText, o estudo aplicou modelos como Regressão Logística, Floresta Aleatória, Naive Bayes e SVM para classificar as marcas. O conjunto de dados utilizado inclui 517.262 descrições de produtos, categorizados em 1.964 marcas distintas. Os resultados experimentais indicam que as combinações de BoW e TF-IDF com os modelos de Regressão Logística e SVM apresentaram os melhores desempenhos, atingindo uma acurácia de 94%. Por outro lado, técnicas como Word2Vec apresentaram desempenho inferior, sugerindo que vetorizadores baseados em contagem continuam sendo mais eficientes para este tipo de tarefa. O estudo conclui que a classificação automática de marcas pode ser significativamente aprimorada com a aplicação de modelos supervisionados, e recomenda o uso de representações mais sofisticadas para futuras melhorias.
Abstract: This work presents the development of an automatic brand classifier using machine learning algorithms, with the objective of identifying product brands based on textual descriptions. Automatic product categorization is a significant challenge in the retail and ERP sectors due to the large volume of unstructured textual data. By utilizing Natural Language Processing (NLP) techniques and textual representations such as Bag of Words (BoW), TF-IDF, Word2Vec, and FastText, the study applied models like Logistic Regression, Random Forest, Naive Bayes, and SVM to classify the brands. The dataset used includes 517,262 product descriptions, categorized into 1,964 distinct brands. Experimental results indicate that the combinations of BoW and TF-IDF with Logistic Regression and SVM models achieved the best performance, reaching an accuracy of 94%. On the other hand, techniques like Word2Vec showed inferior performance, suggesting that count-based vectorizers remain more efficient for this type of task. The study concludes that automatic brand classification can be significantly improved with the application of supervised models and recommends the use of more sophisticated representations for future enhancements.
URI: http://repositorio.ufc.br/handle/riufc/80668
Advisor's Lattes: http://lattes.cnpq.br/8972397134674530
Access Rights: Acesso Aberto
Appears in Collections:ENGENHARIA DE SOFTWARE - QUIXADÁ - TCC

Files in This Item:
File Description SizeFormat 
2025_tcc_imtpompeu.pdf840,83 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.