Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.ufc.br/handle/riufc/78528
Tipo: | TCC |
Título : | Análise utilizando teoria de redes complexas aplicada aos microdados do ENEM |
Autor : | Souza, Luís Eduardo Bino |
Tutor: | César, Carlos Lenz |
Palabras clave en portugués brasileño: | Minimum Spanning Tree;Sistemas Complexos;Microdados do ENEM |
Palabras clave en inglés: | Minimum Spanning Tree;Complex Systems;ENEM Microdata |
Fecha de publicación : | 2024 |
Citación : | SOUZA,L.E.B. Análise utilizando teoria de redes complexas aplicada aos microdados do ENEM. 2024. 85 f. Monografia ( Graduação em Licenciatura em Física) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2024. |
Resumen en portugués brasileño: | A ferramenta de Minimum Spanning Tree (MST), em português Árvore de Abrangência Mínima, tem sido usada para encontrar cluster de similaridades em bolsas de valores, votações de deputados etc. Grande vantagem da técnica é analisar a rede de correlações entre todas as variáveis. A distância de correlação d(i, j) é definida por d(i, j) = p2(1−ρ(i, j)), onde ρ(i, j) é o coeficiente de correlação de Pearson. Os clusters de similaridade são extraídos pela MST obtida com algoritmo de Prim. No ENEM um conjunto de estudantes acima de 100.000 no Ceará respondem às mesmas 180 questões. Uma limpeza inicial, em relação aos dados faltantes, restringiu esse número para aproximadamente 80.000, sobre os quais realizamos uma amostragem de 25.000 alunos estratificada proporcional aos municípios. Os microdados foram obtidos na plataforma Kaggle para os anos de 2018 e 2019 e para os anos de 2020 à 2023 foram obtidos na página do INEP. Colocamos os gabaritos dos 4 tipos de provas presenciais para um gabarito padrão discretizado que usamos para obter a matriz de correlação aluno por aluno. Nosso objetivo é extrair os clusters dos estudantes apenas dos vetores respostas, com os quais analisamos o papel das variáveis socioeconômicas para entender a natureza das correlações. As correlações positivas vieram das melhores notas, como esperado. Também analisamos papel da renda, escolaridade dos pais, município e escola. |
Abstract: | The Minimum Spanning Tree (MST) tool, in Portuguese Minimum Spanning Tree, has been used to find clusters of similarities in stock exchanges, deputy votes, etc. all variables. The brightness distance d(i, j) is defined by d(i, j) = p 2(1−ρ(i, j)), where ρ(i, j) is the Pearson radiance coefficient. Similarity clusters are extracted by MST obtained with Prim’s algorithm. In ENEM, a group of over 100,000 students in Ceará answered the same 180 questions. An initial cleaning, in relation to missing data, restricted this number to approximately 80,000, from which we sampled 25,000 students stratified proportionally by municipality. The microdata were obtained from the Kaggle platform for the years 2018 and 2019 and for the years 2020 to 2023 they were obtained from the INEP page. We placed the templates for the 4 types of face-to-face tests into a discretized standard template that we used to obtain the student-by-student brightness matrix. Our objective is to extract student clusters from response vectors only, with which we analyze the role of socioeconomic variables to understand the nature of correlations. The positive correlations came from the best grades, as expected. We also analyzed the role of income, parental education, municipality and school. |
URI : | http://repositorio.ufc.br/handle/riufc/78528 |
Derechos de acceso: | Acesso Aberto |
Aparece en las colecciones: | FÍSICA - LICENCIATURA - Monografias |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
2024_tcc_lebsousa.pdf | 1,54 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.