Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/81906
Tipo: Dissertação
Título: Análise de discursos parlamentares na Câmara dos Deputados
Autor(es): Santos, Gustavo Franklin Vieira dos
Orientador: Reis, Saulo Davi Soares e
Palavras-chave em português: Análise de discursos;Aprendizado de máquina;Processamento de linguagem;Câmara dos Deputados;Latent Dirichlet
Palavras-chave em inglês: Speech analyzis;Machine learning;Language processing;Chamber of Deputies;Latent Dirichlet
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::FISICA::FISICA DA MATERIA CONDENSADA
Data do documento: 2025
Citação: SANTOS, G. F. V. Análise de discursos parlamentares na Câmara dos Deputados. Dissertação (Mestrado em Física) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2025.
Resumo: Este trabalho tem como objetivo analisar discursos proferidos por deputados federais brasileiros, utilizando técnicas de Processamento de Linguagem Natural e modelagem de tópicos. Foram coletados mais de 900 mil discursos da Câmara dos Deputados, abrangendo o período de 1950 a 2024, realizando uma análise exploratória desses dados, entretanto, será feita a análise dos tópicos somente do ano de 2001, para que assim seja possível validar a técnica proposta. A análise emprega modelos amplamente utilizados na literatura, como o Latent Dirichlet Allocation (LDA), e modelos mais recentes, como o BERTopic, para identificar padrões temáticos e a evolução de assuntos debatidos ao longo do tempo. Para isso, realizou-se a coleta automatizada dos dados via web scraping e aplicou-se uma série de etapas de pré-processamento textual, como lematização e remoção de stop words. A modelagem permitiu não apenas a identificação de tópicos recorrentes, mas também a correlação entre eventos históricos e o conteúdo dos discursos. A abordagem destacou o potencial dos métodos computacionais para análise de grandes volumes de dados textuais no contexto político.
Abstract: This work aims to analyze speeches delivered by Brazilian federal deputies using Natural Language Processing techniques and topic modeling. More than 900,000 speeches from the Chamber of Deputies were collected, covering the period from 1950 to 2024, and an exploratory analysis of this data was conducted. However, the topic modeling analysis focuses exclusively on the year 2001, in order to validate the proposed technique. The analysis employs models widely used in the literature, such as Latent Dirichlet Allocation (LDA), as well as more recent models like BERTopic, to identify thematic patterns and the evolution of topics debated over time. To achieve this, data was automatically collected via web scraping, and a series of textual preprocessing steps were applied, such as lemmatization and stopword removal. The modeling enabled not only the identification of recurring topics but also the correlation between historical events and the content of the speeches. This approach highlights the potential of computational methods for analyzing large volumes of textual data in a political context.
Descrição: SANTOS, G. F. V. Análise de discursos parlamentares na Câmara dos Deputados. Dissertação (Mestrado em Física) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2025.
URI: http://repositorio.ufc.br/handle/riufc/81906
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:DFI - Dissertações defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2025_dis_gfvsantos.pdf4,73 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.