Enriquecimento de dicionários para aprimoramento da classificação automática de sentimento em postagens relacionadas ao uso de sistemas.

Lima, Afonso Matheus Sousa

Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/39082

Tipo:	TCC
Título :	Enriquecimento de dicionários para aprimoramento da classificação automática de sentimento em postagens relacionadas ao uso de sistemas.
Autor :	Lima, Afonso Matheus Sousa
Tutor:	Mendes, Marília Mendes
Co-asesor:	Rafael, Lívia Almada Cruz
Palabras clave :	Avaliação de sistemas;Análise de sentimentos;Classificadores léxicos
Fecha de publicación :	2018
Citación :	LIMA, Afonso Matheus Sousa. Enriquecimento de dicionários para aprimoramento da classificação automática de sentimento em postagens relacionadas ao uso de sistemas. 2018. 46 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Universidade Federal do Ceará, Campus de Russas, Russas, 2018.
Resumen en portugués brasileño:	A avaliação textual consiste em usar narrativas dos usuários a fim de avaliar ou obter alguma percepção sobre o sistema por meio de suas postagens. Tal avaliação é muito importante, pois a crescente popularização e disseminação das aplicações desenvolvidas e o aumento do padrão de qualidade exigido pelos usuários são características cada vez mais presentes atualmente. Torna-se, então, necessário que as desenvolvedoras de softwares aprimorem suas aplicações regularmente, uma vez que a concorrência sempre está presente e a necessidade do usuário pode mudar repentinamente. Por isso, é indispensável que sejam estudadas formas de efetuar a avaliação textual de forma automática, uma vez que classificar manualmente a grande quantidade de informação disponibilizada por usuários em tempo viável é uma tarefa impossível. Ainda há, também, a dificuldade de detectar o sentimento (positivo, neutro ou negativo) do usuário sobre o sistema por meio de postagens escritas em português. Baseado nessa problemática, este trabalho apresenta uma investigação para melhorar a qualidade da classificação de um classificador baseado em léxico, o SentiStrength, para detecção automática de sentimento em postagens relacionadas ao uso de sistemas. Para atingir tal objetivo, foi utilizada a métrica TF-IDF para a seleção de palavras que estão dentro do domínio das postagens relacionadas ao uso do sistema, as quais irão enriquecer o dicionário utilizado pelo SentiStrength para gerar a polaridade das postagens. Também foi investigada a eficiência de dicionários enriquecidos com palavras em sua raiz (stemming) e com palavras lematizadas. A investigação foi realizada com 2108 sentenças extraídas da seção de resenhas da Play Store sobre aplicativos de mobilidade urbana, sendo eles o Waze, Google Maps e GPS Brasil. Um dos resultados obtidos foi um aumento médio de 7,3% na acurácia do classificador quando utilizado os dicionários enriquecidos.
Abstract:	Textual evaluation consists of using user narratives in order to assess or gain some insight into the system through its postings. This evaluation is very important, since the increasing popularization and dissemination of the developed applications and the increase of the quality standard demanded by the users are characteristics more and more present at the moment. It then becomes necessary for software developers to enhance their applications on a regular basis, since competition is always present and the user’s need may change suddenly. For this reason, it is indispensable to study ways to perform textual evaluation automatically, since manually classifying the large amount of information made available by users in a viable time is an impossible task. There is also the difficulty of detecting the user’s positive, neutral or negative feelings about the system through written Portuguese posts. Based on this problem, this work presents an investigation to improve the classification of a lexical-based classifier, the SentiStrength, for automatic classification of sentiments in postings related to the use of systems. To achieve this goal, the TF-IDF metric was used to select words that are within the domain of the related posts, which will enrich the dictionary used by the SentiStrength to generate the polarity of the posts. We also investigated the efficiency of dictionaries enriched with words in their root (stemming) and with lemmatized words. The research was conducted with 2108 sentences extracted from the reviews section of the Play Store on urban mobility applications, such as Waze, Google Maps and GPS Brasil. One of the results obtained was an average increase of 7.3 % in the accuracy of the classifier when using the enriched dictionaries.
URI :	http://www.repositorio.ufc.br/handle/riufc/39082
Aparece en las colecciones:	CIÊNCIA DA COMPUTAÇÃO - RUSSAS - Monografias

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
2018_tcc_amslima.pdf		473,61 kB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem