Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/80668| Type: | TCC |
| Title: | Classificação automática de marcas utilizando algoritmos de aprendizado de máquina |
| Authors: | Pompeu, Ian Mateus Torres |
| Advisor: | Cruz, Lívia Almada |
| Keywords in Brazilian Portuguese : | classificação de marcas;aprendizado de máquina;processamento de linguagem natural |
| Knowledge Areas - CNPq: | CNPQ: CIÊNCIAS EXATAS E DA TERRA |
| Issue Date: | 2025 |
| Citation: | POMPEU, Ian Mateus Torres. Classificação automática de marcas utilizando algoritmos de aprendizado de máquina. 2025. 55 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Software)- Campus de Quixadá, Universidade Federal do Ceará, Quixadá, 2025. |
| Abstract in Brazilian Portuguese: | Este trabalho apresenta o desenvolvimento de um classificador automático de marcas utilizando algoritmos de aprendizado de máquina, com o objetivo de identificar marcas de produtos a partir de descrições textuais. A categorização automática de produtos é um desafio significativo no setor de varejo e ERP devido ao grande volume de dados textuais não estruturados. Utilizando técnicas de Processamento de Linguagem Natural (PLN) e representações textuais como Bag of Words (BoW), TF-IDF, Word2Vec e FastText, o estudo aplicou modelos como Regressão Logística, Floresta Aleatória, Naive Bayes e SVM para classificar as marcas. O conjunto de dados utilizado inclui 517.262 descrições de produtos, categorizados em 1.964 marcas distintas. Os resultados experimentais indicam que as combinações de BoW e TF-IDF com os modelos de Regressão Logística e SVM apresentaram os melhores desempenhos, atingindo uma acurácia de 94%. Por outro lado, técnicas como Word2Vec apresentaram desempenho inferior, sugerindo que vetorizadores baseados em contagem continuam sendo mais eficientes para este tipo de tarefa. O estudo conclui que a classificação automática de marcas pode ser significativamente aprimorada com a aplicação de modelos supervisionados, e recomenda o uso de representações mais sofisticadas para futuras melhorias. |
| Abstract: | This work presents the development of an automatic brand classifier using machine learning algorithms, with the objective of identifying product brands based on textual descriptions. Automatic product categorization is a significant challenge in the retail and ERP sectors due to the large volume of unstructured textual data. By utilizing Natural Language Processing (NLP) techniques and textual representations such as Bag of Words (BoW), TF-IDF, Word2Vec, and FastText, the study applied models like Logistic Regression, Random Forest, Naive Bayes, and SVM to classify the brands. The dataset used includes 517,262 product descriptions, categorized into 1,964 distinct brands. Experimental results indicate that the combinations of BoW and TF-IDF with Logistic Regression and SVM models achieved the best performance, reaching an accuracy of 94%. On the other hand, techniques like Word2Vec showed inferior performance, suggesting that count-based vectorizers remain more efficient for this type of task. The study concludes that automatic brand classification can be significantly improved with the application of supervised models and recommends the use of more sophisticated representations for future enhancements. |
| URI: | http://repositorio.ufc.br/handle/riufc/80668 |
| Advisor's Lattes: | http://lattes.cnpq.br/8972397134674530 |
| Access Rights: | Acesso Aberto |
| Appears in Collections: | ENGENHARIA DE SOFTWARE - QUIXADÁ - TCC |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 2025_tcc_imtpompeu.pdf | 840,83 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.