Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/29530
Tipo: TCC
Título: Classificação de Polaridade de Sentimentos de Mensagens Curtas Utilizando Word2Vec
Autor(es): Lima, Raul de Araújo
Orientador: Oliveira, Paulo de Tarso Guerra
Palavras-chave: Emoções-Análise;Mensagens eletrônicas;Word2Vec
Data do documento: 2017
Citação: LIMA, Raul de Araújo. Classificação de Polaridade de Sentimentos de Mensagens Curtas Utilizando Word2Vec. 2017. 49 f. TCC (Graduação em Ciência da Computação) - Universidade Federal do Ceará, Campus Quixadá, Quixadá, 2017.
Resumo: A análise de sentimentos e a classificação de polaridade de textos constitui-se como uma das principais ferramentas atualmente utilizadas por empresas e organizações para os mais variados fins. Dentre as muitas técnicas empregadas para essa finalidade, a representação vetorial incorporada de palavras, unida aos classificadores de Aprendizado de Máquina, tem se destacado e atraído a atenção da comunidade científica. Este trabalho faz uma análise da utilização da representação vetorial incorporada de palavras, construída através do Word2Vec, no processo de extração de features para a classificação de polaridade de mensagens curtas escritas em língua inglesa. Os textos utilizados foram extraídos do Twitter e os resultados obtidos mostram que, apesar da possível necessidade da utilização de bases textuais maiores para que sejam obtidos vetores mais bem incorporados, o Word2Vec constitui-se como uma ferramenta promissora para a extração de features textuais, contribuindo para a obtenção de bons resultados de classificação.
Abstract: The Sentiment Analisys and the polarity classification of texts constitutes one of the main tools currently used by companies and organizations for the most varied purposes. Among the many techniques used for this purpose, the vector representation of words, together with the Machine Learning classifiers, is attracting the attention of the scientific community. This work makes an analysis of the use of word embeddings, built through Word2Vec, in the process of features extraction for polarity classification of short messages written in English. The texts used were extracted from Twitter, one of the largest social networks currently used. The results obtained show that, in spite of the possible need to use larger textual bases to obtain better vectors, Word2Vec is a promising tool for the features extraction of textual data, contributing to obtain good classification results.
URI: http://www.repositorio.ufc.br/handle/riufc/29530
Aparece nas coleções:CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2017_tcc_ralima.pdf812,16 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.