Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/24819
Tipo: | TCC |
Título: | Identificando emoções em manchetes de notícias escritas em português do Brasil utilizando Naïve Bayes |
Autor(es): | Oliveira, André Davys Carvalho Melo de |
Orientador: | Oliveira, Paulo de Tarso Guerra |
Palavras-chave: | Linguística - Processamento de dados;Processamento de textos (Computação);Algoritmos |
Data do documento: | 2016 |
Citação: | OLIVEIRA, André Davys Carvalho Melo de. Identificando emoções em manchetes de notícias escritas em português do Brasil utilizando Naïve Bayes. 2016. TCC (graduação em Ciência da Computação) - Universidade Federal do Ceará, Campus Quixadá, Quixadá, 2016. |
Resumo: | O grande aumento do número de usuários da internet permitiu que dados que contém opinião e/ou sentimento de usuários crescessem em uma velocidade espantosa. Dessa forma, a maioria dos jornais disponibiliza diariamente suas publicações em seus sites. Com essa popularização da internet, o volume de dados disponível na internet cresce exponencialmente e analisar tais dados de forma não automatizada pode ser uma tarefa difícil. Visto isso, este trabalho apresenta um método para identificar automaticamente emoções em textos. O objetivo principal é construir um modelo capaz de identificar uma das seis emoções básicas (alegria, tristeza, surpresa, medo, raiva e desgosto) em manchetes de notícias escritas em português do Brasil. Para a construção do modelo é utilizada uma abordagem de aprendizado de máquina baseada no classificador Naïve Bayes. O corpus (conjunto de dados) utilizado neste trabalho é composto de manchetes de notícias retiradas de jornais onlines. Estas notícias foram submetidas a um classificador Naïve Bayes, obtendo uma taxa de acerto média de 59,5%. |
Abstract: | The large increase in the number of users on the internet has allowed that data contains opinion or sentiment of user to grow at an amazing speed. In this way, most newspapers offer their daily publications on their sites. Considering the popularization on the internet, this big amount of available data on the internet grows exponentially and analyzing such data in a non-automated way can be a non-trivial problem. Thus, this paper shows a method to identify automatically emotions in text. The goal is to build a model able to identify one of the six basic emotions (joy, sadness, surprise, fear, anger and disgust) in news headlines written in Brazilian Portuguese. For the build of the model, we use a machine learning approach based on the Naïve Bayes classifier. The corpus (dataset) used in this work is composed by news extracted from online newspapers. This news were processed by our Naïve Bayes classifier getting an accuracy rate of 59,5%. |
URI: | http://www.repositorio.ufc.br/handle/riufc/24819 |
Aparece nas coleções: | CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2016_tcc_adcmdeoliveira.pdf | 2,69 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.