Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/81906| Tipo: | Dissertação |
| Título: | Análise de discursos parlamentares na Câmara dos Deputados |
| Autor(es): | Santos, Gustavo Franklin Vieira dos |
| Orientador: | Reis, Saulo Davi Soares e |
| Palavras-chave em português: | Análise de discursos;Aprendizado de máquina;Processamento de linguagem;Câmara dos Deputados;Latent Dirichlet |
| Palavras-chave em inglês: | Speech analyzis;Machine learning;Language processing;Chamber of Deputies;Latent Dirichlet |
| CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::FISICA::FISICA DA MATERIA CONDENSADA |
| Data do documento: | 2025 |
| Citação: | SANTOS, G. F. V. Análise de discursos parlamentares na Câmara dos Deputados. Dissertação (Mestrado em Física) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2025. |
| Resumo: | Este trabalho tem como objetivo analisar discursos proferidos por deputados federais brasileiros, utilizando técnicas de Processamento de Linguagem Natural e modelagem de tópicos. Foram coletados mais de 900 mil discursos da Câmara dos Deputados, abrangendo o período de 1950 a 2024, realizando uma análise exploratória desses dados, entretanto, será feita a análise dos tópicos somente do ano de 2001, para que assim seja possível validar a técnica proposta. A análise emprega modelos amplamente utilizados na literatura, como o Latent Dirichlet Allocation (LDA), e modelos mais recentes, como o BERTopic, para identificar padrões temáticos e a evolução de assuntos debatidos ao longo do tempo. Para isso, realizou-se a coleta automatizada dos dados via web scraping e aplicou-se uma série de etapas de pré-processamento textual, como lematização e remoção de stop words. A modelagem permitiu não apenas a identificação de tópicos recorrentes, mas também a correlação entre eventos históricos e o conteúdo dos discursos. A abordagem destacou o potencial dos métodos computacionais para análise de grandes volumes de dados textuais no contexto político. |
| Abstract: | This work aims to analyze speeches delivered by Brazilian federal deputies using Natural Language Processing techniques and topic modeling. More than 900,000 speeches from the Chamber of Deputies were collected, covering the period from 1950 to 2024, and an exploratory analysis of this data was conducted. However, the topic modeling analysis focuses exclusively on the year 2001, in order to validate the proposed technique. The analysis employs models widely used in the literature, such as Latent Dirichlet Allocation (LDA), as well as more recent models like BERTopic, to identify thematic patterns and the evolution of topics debated over time. To achieve this, data was automatically collected via web scraping, and a series of textual preprocessing steps were applied, such as lemmatization and stopword removal. The modeling enabled not only the identification of recurring topics but also the correlation between historical events and the content of the speeches. This approach highlights the potential of computational methods for analyzing large volumes of textual data in a political context. |
| Descrição: | SANTOS, G. F. V. Análise de discursos parlamentares na Câmara dos Deputados. Dissertação (Mestrado em Física) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2025. |
| URI: | http://repositorio.ufc.br/handle/riufc/81906 |
| Tipo de Acesso: | Acesso Aberto |
| Aparece nas coleções: | DFI - Dissertações defendidas na UFC |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| 2025_dis_gfvsantos.pdf | 4,73 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.