Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/29530
Type: TCC
Title: Classificação de Polaridade de Sentimentos de Mensagens Curtas Utilizando Word2Vec
Authors: Lima, Raul de Araújo
Advisor: Oliveira, Paulo de Tarso Guerra
Keywords: Emoções-Análise;Mensagens eletrônicas;Word2Vec
Issue Date: 2017
Citation: LIMA, Raul de Araújo. Classificação de Polaridade de Sentimentos de Mensagens Curtas Utilizando Word2Vec. 2017. 49 f. TCC (Graduação em Ciência da Computação) - Universidade Federal do Ceará, Campus Quixadá, Quixadá, 2017.
Abstract in Brazilian Portuguese: A análise de sentimentos e a classificação de polaridade de textos constitui-se como uma das principais ferramentas atualmente utilizadas por empresas e organizações para os mais variados fins. Dentre as muitas técnicas empregadas para essa finalidade, a representação vetorial incorporada de palavras, unida aos classificadores de Aprendizado de Máquina, tem se destacado e atraído a atenção da comunidade científica. Este trabalho faz uma análise da utilização da representação vetorial incorporada de palavras, construída através do Word2Vec, no processo de extração de features para a classificação de polaridade de mensagens curtas escritas em língua inglesa. Os textos utilizados foram extraídos do Twitter e os resultados obtidos mostram que, apesar da possível necessidade da utilização de bases textuais maiores para que sejam obtidos vetores mais bem incorporados, o Word2Vec constitui-se como uma ferramenta promissora para a extração de features textuais, contribuindo para a obtenção de bons resultados de classificação.
Abstract: The Sentiment Analisys and the polarity classification of texts constitutes one of the main tools currently used by companies and organizations for the most varied purposes. Among the many techniques used for this purpose, the vector representation of words, together with the Machine Learning classifiers, is attracting the attention of the scientific community. This work makes an analysis of the use of word embeddings, built through Word2Vec, in the process of features extraction for polarity classification of short messages written in English. The texts used were extracted from Twitter, one of the largest social networks currently used. The results obtained show that, in spite of the possible need to use larger textual bases to obtain better vectors, Word2Vec is a promising tool for the features extraction of textual data, contributing to obtain good classification results.
URI: http://www.repositorio.ufc.br/handle/riufc/29530
Appears in Collections:CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias

Files in This Item:
File Description SizeFormat 
2017_tcc_ralima.pdf812,16 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.