Please use this identifier to cite or link to this item: http://www.repositorio.ufc.br/handle/riufc/34535
Title in Portuguese: Detecção de comentários pejorativos em vídeos infanto-juvenis do Youtube
Author: Silva, Luiz Isaias de Souza
Advisor(s): Silva, Ticiana Linhares Coelho da
Keywords: Crianças-Adolescentes-Proteção
Sistemas de Recuperação da Informação
Mineração de Dados (Computação)
Software-Desenvolvimento
Issue Date: 2018
Citation: SILVA, Luiz Isaias de Souza. Detecção de comentários pejorativos em vídeos infanto-juvenis do Youtube. 2018. 54 f. TCC (Graduação em Engenharia de Software) - Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2018.
Abstract in Portuguese: A Internet, rede mundial de computadores, conecta cada vez mais pessoas ao redor do mundo. Em um dos sites mais acessados do mundo, a plataforma de vídeos Youtube, é notável a participação ativa de jovens e crianças nos comentários dos vídeos. Também é notável a quantidade de ofensas direcionadas aos usuários, nesses comentários. Quando os vídeos são direcionados às crianças e adolescentes, isso pode influenciar negativamente os jovens e ferir o Estatuto da Criança e do Adolescente brasileiro que afirma: "Deve ser respeitado a integridade física, moral e psíquica da criança e do adolescente". Com o objetivo de detectar se um vídeo no Youtube, direcionado aos jovens, possui muitos comentários negativos desenvolvemos um classificador textual Naïve Bayes e uma extensão para o navegador Google Chrome, que indica a taxa de comentários pejorativos contidos no vídeo. Para analisar comentários de vídeos do Youtube e montar o modelo de classificação textual, foram utilizadas ferramentas de mineração e classificação de dados NLTK, scikit-learn e SentiStrength. Para auxiliar e automatizar os passos de coleta e extração dos comentários de vídeos do Youtube, o autor desenvolveu vários scripts na linguagem Python. Uma extensão para Google Chrome foi desenvolvida, utilizando tecnologias web, para aproveitar os dados de classificação gerados, e facilitar a realização de novas classificações. Ao total, 87.094 comentários foram coletados, e 62.121 foram analisados, apresentando 48.773 comentários considerados neutros e 13.348 comentários considerados pejorativos. Observou-se que vídeos direcionados à crianças não possuem altas taxas de comentários negativos, e por outro lado, vídeos direcionados a jovens, possuem uma taxa de 34% de comentários pejorativos, ou seja vídeos direcionados à adolescentes possuem mais termos ofensivos em seus comentários.
Abstract: Internet or World Wide Web is connecting more and more people each day. In Youtube, a video streaming platform and one of Internet’s most popular websites, is noticeable how teenagers and kids are actively engaged in the comments section. Also noticeable are the offenses in these comments, directed to the users. When the videos are targeted to children and teenagers audience, this may negatively influence those younger ones, and it goes against Brazil’s "Estatuto da Criança e do Adolescente", a constitutional law that protects children, as it says: "It should be respected the physical, moral and psychical integrity of children and teenagers alike." With the goal to detect if a Youtube video, targeted at kids and teenagers, has lots of offensive comments, it was built a Naïve Bayes textual classifier and a Google Chrome Browser Extension, which indicates the rates of offensive comments for the video. To analyze the Youtube video comments and to build the text classification model, it was used data classification and data mining tools: NLTK, scikit-learn, and Sentistrength. To help and automate the data collection and extraction steps, many scripts in Python were developed. Finally, a Google Chrome Extension was built, using web technologies, to display the resultant data for the public and to make easier to have new classifications. 87.094 comments were collected, and 62.121 were analyzed and classified. Showing that 48.773 comments could be considered neutral and 13.348 could be considered offensive. It was noted that videos targeted at children did not have high offensive comments rate, while videos targeted at teenagers had a considerable rate, about 34% for offensive comments. This means that videos targeted at teenagers tend to have more offensive comments than videos targeted at children.
URI: http://www.repositorio.ufc.br/handle/riufc/34535
metadata.dc.type: TCC
Appears in Collections:ENGENHARIA DE SOFTWARE - QUIXADÁ - TCC

Files in This Item:
File Description SizeFormat 
2018_tcc_lissilva.pdf969,26 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.