Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/24819
Type: TCC
Title: Identificando emoções em manchetes de notícias escritas em português do Brasil utilizando Naïve Bayes
Authors: Oliveira, André Davys Carvalho Melo de
Advisor: Oliveira, Paulo de Tarso Guerra
Keywords: Linguística - Processamento de dados;Processamento de textos (Computação);Algoritmos
Issue Date: 2016
Citation: OLIVEIRA, André Davys Carvalho Melo de. Identificando emoções em manchetes de notícias escritas em português do Brasil utilizando Naïve Bayes. 2016. TCC (graduação em Ciência da Computação) - Universidade Federal do Ceará, Campus Quixadá, Quixadá, 2016.
Abstract in Brazilian Portuguese: O grande aumento do número de usuários da internet permitiu que dados que contém opinião e/ou sentimento de usuários crescessem em uma velocidade espantosa. Dessa forma, a maioria dos jornais disponibiliza diariamente suas publicações em seus sites. Com essa popularização da internet, o volume de dados disponível na internet cresce exponencialmente e analisar tais dados de forma não automatizada pode ser uma tarefa difícil. Visto isso, este trabalho apresenta um método para identificar automaticamente emoções em textos. O objetivo principal é construir um modelo capaz de identificar uma das seis emoções básicas (alegria, tristeza, surpresa, medo, raiva e desgosto) em manchetes de notícias escritas em português do Brasil. Para a construção do modelo é utilizada uma abordagem de aprendizado de máquina baseada no classificador Naïve Bayes. O corpus (conjunto de dados) utilizado neste trabalho é composto de manchetes de notícias retiradas de jornais onlines. Estas notícias foram submetidas a um classificador Naïve Bayes, obtendo uma taxa de acerto média de 59,5%.
Abstract: The large increase in the number of users on the internet has allowed that data contains opinion or sentiment of user to grow at an amazing speed. In this way, most newspapers offer their daily publications on their sites. Considering the popularization on the internet, this big amount of available data on the internet grows exponentially and analyzing such data in a non-automated way can be a non-trivial problem. Thus, this paper shows a method to identify automatically emotions in text. The goal is to build a model able to identify one of the six basic emotions (joy, sadness, surprise, fear, anger and disgust) in news headlines written in Brazilian Portuguese. For the build of the model, we use a machine learning approach based on the Naïve Bayes classifier. The corpus (dataset) used in this work is composed by news extracted from online newspapers. This news were processed by our Naïve Bayes classifier getting an accuracy rate of 59,5%.
URI: http://www.repositorio.ufc.br/handle/riufc/24819
Appears in Collections:CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias

Files in This Item:
File Description SizeFormat 
2016_tcc_adcmdeoliveira.pdf2,69 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.