Please use this identifier to cite or link to this item: http://www.repositorio.ufc.br/handle/riufc/24793
Title in Portuguese: Detecção de atributos que melhor caracterizam perfis de inscritos do ENEM utilizando Redução de Dimensionalidade
Author: Moreira, Natália Lionel
Advisor(s): Silva, Ticiana Linhares Coelho da
Keywords: Mineração de dados (Computação)
Exame Nacional do Ensino Médio
Análise por agrupamento
Issue Date: 2016
Citation: MOREIRA, Natália Lionel. Detecção de atributos que melhor caracterizam perfis de inscritos do ENEM utilizando redução de dimensionalidade. 2016. TCC (graduação em Sistemas de Informação) - Universidade Federal do Ceará, Campus Quixadá, Quixadá, 2016.
Abstract in Portuguese: O Exame Nacional do Ensino Médio - ENEM desde 2010 tem sido utilizado como o principal meio de ingressar em instituições de ensino superior, tornando-se, então, um vestibular nacional. Este fato causou um aumento da quantidade de interessados em realizar o exame, gerando um grande volume de dados sendo a base do ENEM uma base de alta dimensionalidade. A mineração de dados permite extrair conhecimentos a partir de um grande volume de dados, dentre as técnicas de mineração de dados está a clusterização. Utilizando esta técnica é possível identificar perfis de inscritos do ENEM com base em fatores socioeconômicos. É importante utilizar método de seleção de atributos em bases de alta dimensionalidade para identificar os atributos mais caracterizantes de uma base, a escolha aleatória de atributos pode causar resultado incorreto ou inútil. Tendo em vista a existência de diferentes abordagens de seleção de atributos, este trabalho visa comparar as abordagens filter e wrapper, utilizando diferentes algoritmos de busca, para identificar a que apresenta melhores resultados. Neste estudo foram utilizados dados do ENEM de 2010 para identificar perfis de inscritos, via clusterização, buscando relacionar a média obtida na prova com os dados socioeconômicos informados pelo inscrito no ato da inscrição. Além disso é realizada uma análise entre os clusters obtidos neste estudo e no trabalho de (CAMINHA; MOREIRA; SILVA, 2015), que faz um estudo semelhante a este utilizando, também, base do ENEM. Com este estudo foi possível concluir que os fatores socioeconômicos não possuem grande impacto na nota final da prova, não podendo, portanto, influência-la nos dados analisados.
Abstract: Since 2010, the Exame Nacional do Ensino Medio - ENEM has been used as the only exam to apply for a position in some Brazilian. Because of this, the number of candidates interested in the exam has increased and a large volume of data has being collected from them. This has made ENEM a high dimensional dataset. Data mining can extract knownledge from a large volume of data. One of the most important data mining technique is clustering. By using this technique it is possible to identify profiles of members based on socioeconomic questions usually answered by ENEM candidates. It is important to use feature selection method in high dimensional databases to identify the most characterizing attributes of a dataset and improve the efficiency, since high dimensional data is more costly to process. Futhermore, the random choice of attributes can produce incorrect or useless results. By using different approaches to select attributes, this study aims to compare the filter and wrapper approaches with different searching algorithms and then identify the one of the best results. In this work, the ENEM data from 2010 was used to identify profiles via clustering algorithm, trying to relate the average grade obtained in the exam with socioeconomic data provided by each candidate upon his/her registration. In addition, an analysis was made between the clusters obtained in this study and the work of (CAMINHA; MOREIRA; SILVA, 2015) which makes a similar study using the same data. This study was concluded that socioeconomic factors do not have major impact on the final grade and can not therefore influence it (at least for 2010 data).
URI: http://www.repositorio.ufc.br/handle/riufc/24793
metadata.dc.type: TCC
Appears in Collections:SISTEMAS DE INFORMAÇÃO - QUIXADÁ - TCC

Files in This Item:
File Description SizeFormat 
2016_tcc_nlmoreira.pdf1,98 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.