Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/78528
Type: | TCC |
Title: | Análise utilizando teoria de redes complexas aplicada aos microdados do ENEM |
Authors: | Souza, Luís Eduardo Bino |
Advisor: | César, Carlos Lenz |
Keywords in Brazilian Portuguese : | Minimum Spanning Tree;Sistemas Complexos;Microdados do ENEM |
Keywords in English : | Minimum Spanning Tree;Complex Systems;ENEM Microdata |
Issue Date: | 2024 |
Citation: | SOUZA,L.E.B. Análise utilizando teoria de redes complexas aplicada aos microdados do ENEM. 2024. 85 f. Monografia ( Graduação em Licenciatura em Física) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2024. |
Abstract in Brazilian Portuguese: | A ferramenta de Minimum Spanning Tree (MST), em português Árvore de Abrangência Mínima, tem sido usada para encontrar cluster de similaridades em bolsas de valores, votações de deputados etc. Grande vantagem da técnica é analisar a rede de correlações entre todas as variáveis. A distância de correlação d(i, j) é definida por d(i, j) = p2(1−ρ(i, j)), onde ρ(i, j) é o coeficiente de correlação de Pearson. Os clusters de similaridade são extraídos pela MST obtida com algoritmo de Prim. No ENEM um conjunto de estudantes acima de 100.000 no Ceará respondem às mesmas 180 questões. Uma limpeza inicial, em relação aos dados faltantes, restringiu esse número para aproximadamente 80.000, sobre os quais realizamos uma amostragem de 25.000 alunos estratificada proporcional aos municípios. Os microdados foram obtidos na plataforma Kaggle para os anos de 2018 e 2019 e para os anos de 2020 à 2023 foram obtidos na página do INEP. Colocamos os gabaritos dos 4 tipos de provas presenciais para um gabarito padrão discretizado que usamos para obter a matriz de correlação aluno por aluno. Nosso objetivo é extrair os clusters dos estudantes apenas dos vetores respostas, com os quais analisamos o papel das variáveis socioeconômicas para entender a natureza das correlações. As correlações positivas vieram das melhores notas, como esperado. Também analisamos papel da renda, escolaridade dos pais, município e escola. |
Abstract: | The Minimum Spanning Tree (MST) tool, in Portuguese Minimum Spanning Tree, has been used to find clusters of similarities in stock exchanges, deputy votes, etc. all variables. The brightness distance d(i, j) is defined by d(i, j) = p 2(1−ρ(i, j)), where ρ(i, j) is the Pearson radiance coefficient. Similarity clusters are extracted by MST obtained with Prim’s algorithm. In ENEM, a group of over 100,000 students in Ceará answered the same 180 questions. An initial cleaning, in relation to missing data, restricted this number to approximately 80,000, from which we sampled 25,000 students stratified proportionally by municipality. The microdata were obtained from the Kaggle platform for the years 2018 and 2019 and for the years 2020 to 2023 they were obtained from the INEP page. We placed the templates for the 4 types of face-to-face tests into a discretized standard template that we used to obtain the student-by-student brightness matrix. Our objective is to extract student clusters from response vectors only, with which we analyze the role of socioeconomic variables to understand the nature of correlations. The positive correlations came from the best grades, as expected. We also analyzed the role of income, parental education, municipality and school. |
URI: | http://repositorio.ufc.br/handle/riufc/78528 |
Access Rights: | Acesso Aberto |
Appears in Collections: | FÍSICA - LICENCIATURA - Monografias |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2024_tcc_lebsousa.pdf | 1,54 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.