Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/79291
Tipo: | TCC |
Título: | Detecção de notícias falsas usando técnicas de aprendizado de máquina e aprendizado profundo |
Autor(es): | Silva Júnior, Francisco Jerônimo da |
Orientador: | Cruz, Lívia Almada |
Palavras-chave em português: | aprendizado de máquina;aprendizado profundo;classificação de texto;processamento de linguagem natural;representação de textos |
CNPq: | CNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
Data do documento: | 2024 |
Citação: | SILVA JÚNIOR, Francisco Jerônimo da. Detecção de notícias falsas usando técnicas de aprendizado de máquina e aprendizado profundo. 2024. 62 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2024. |
Resumo: | Este trabalho aborda a crescente problemática da disseminação de informações falsas, impulsionada pelo avanço das redes sociais como principal meio de comunicação. O objetivo do trabalho é desenvolver modelos capazes de detectar notícias falsas utilizando combinações de técnicas de Processamento de Linguagem Natural, Aprendizado de Máquina e Aprendizado Profundo. No trabalho, foram desenvolvidas estratégias de pré-processamento textual, como a aplicação de stemming e a remoção de stopwords, além de outros procedimentos para garantir que o texto permanecesse sem ruídos. Foram utilizadas representações de dados para a conversão do texto em uma representação numérica, como Bag-of-Words (TF-IDF), e diferentes modelos de word embeddings, entre eles FastText, Word2Vec e GloVe. Para a realização dos experimentos foram utilizados um conjunto de diferentes algoritmos de aprendizado, incluindo algoritmos tradicionais de aprendizado de máquina, entre eles a Logístic Regression, Random Forest, Support Vector Machines (SVM) e o Stochastic Gradient Descent Classifier (SGDC), além do emprego de arquiteturas de aprendizado profundo, como redes neurais LSTM e o modelo de linguagem BERT. Os experimentos foram aplicados sobre dois conjuntos de dados: Fake.Br e FakeRecogna, ambos compostos por notícias em português, rotuladas como verdadeiras ou falsas. O experimento com o modelo BERT obteve o melhor desempenho para ambos os conjuntos de dados, alcançando um F1-Score de 96.30% para o Fake.Br e de 95.21% para o FakeRecogna. |
Abstract: | This work addresses the growing issue of the dissemination of false information, driven by the rise of social media as the main means of communication. The goal of the study is to develop models capable of detecting fake news using combinations of Natural Language Processing, Machine Learning, and Deep Learning techniques. In this study, textual preprocessing strategies were developed, such as the application of stemming and the removal of stopwords, as well as other procedures to ensure the text remained noise-free. Data representations were used to convert the text into a numerical representation, such as Bag-of-Words (TF-IDF), and different word embedding models, including FastText, Word2Vec, and GloVe. For the experiments, a set of different learning algorithms was employed, including traditional machine learning algorithms such as Logistic Regression, Random Forest, Support Vector Machines (SVM), and the Stochastic Gradient Descent Classifier (SGDC), in addition to the use of deep learning architectures, such as LSTM neural networks and the BERT language model. The experiments were conducted on two datasets: Fake.Br and FakeRecogna, both composed of Portuguese news articles labeled as true or false. The experiment with the BERT model achieved the best performance for both datasets, reaching an F1-Score of 96.30% for Fake.Br and 95.21% for FakeRecogna. |
URI: | http://repositorio.ufc.br/handle/riufc/79291 |
Currículo Lattes do Orientador: | http://lattes.cnpq.br/8972397134674530 |
Tipo de Acesso: | Acesso Aberto |
Aparece nas coleções: | CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2024_tcc_fjsilvajunior.pdf | 1,75 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.