Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/73132
Tipo: | Dissertação |
Título: | Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará. |
Título em inglês: | Machine learning to predict dropout and evasion of students in the State of Ceará |
Autor(es): | Teles, Igor Antônio Gomes |
Orientador: | Fernandes, Carlos Alexandre Rolim |
Coorientador: | Benevides, Alesandra de Araújo |
Palavras-chave: | Evasão Escolar;Violência;Machine Learning;Predição |
Data do documento: | 27-Jan-2023 |
Citação: | TELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023. |
Resumo: | O abandono e a evasão escolar são temas frequentes na Educação. Os números dão ideia do tamanho do problema. Em 2018, cerca de quatro em cada dez brasileiros de 19 anos não concluíram o Ensino Médio com base na Pesquisa Nacional por Amostra de Domicílios Contínua (PnadC), do IBGE. O abandono ocorre quando o aluno deixa de frequentar as aulas durante o ano letivo. Já a evasão escolar diz respeito à situação do aluno que abandonou a escola ou reprovou em determinado ano letivo, e que no ano seguinte não efetuou a matrícula para dar continuidade aos estudos. Dito isso, o propósito deste projeto é propor modelos de predição de situações de evasão e abandono para alunos do estado do Ceará, usando bases de dados sociais, de desempenho escolar e em registros das mães nas bases de dados CVLI e Maria da Penha. Outro propósito do trabalho é determinar quais fatores são os que mais impactam na evasão e abandono. Foram utilizados os dados longitudinais dos anos de 2012 a 2019 dos dados escolares obtidos do Censo Escolar para verificar a situação dos alunos que evadiram ou abandonaram. No total, foram usadas 4 bases de dados: Censo escolar, SPAECE, CVLI e Maria da Penha. Os procedimentos foram realizados através do sistema gerenciador de banco de dados Postgresql, Software SPSS e o Weka. Após o pré-processamento, limpeza e aplicação de filtros, os dados foram utilizados para treinamento da máquina e verificação de predição para tomadas de decisão acerca de possíveis situações de evasão e abandono. Foram utilizados os classificadores Multilayer Perceptron (MLP), Support Vector Machine (SVM) e Floresta aleatória, foi também aplicado Correlation based feature selection - CFS para encontrar os melhores atributos para o estudo, sendo selecionados como atributos o desempenho em português e matemática, etnia, etapa de ensino e o indicador da presença da mãe em bases de violência. Foram alcançadas as respectivas acuracias 83,9 %, 78,24% e 71,4 %, onde se conclui que o classificador MLP obteve o melhor resultado. |
Abstract: | Leaving and dropping out of school are frequent themes in Education. The numbers give an idea of the size of the problem. In 2018, around four out of ten 19-year-old Brazilians did not finish high school based on the Continuous National Household Sample Survey (PnadC), by IBGE. Dropout occurs when the student stops attending classes during the school year. School dropout, on the other hand, concerns the situation of the student who dropped out of school or failed in a given school year, and who in the following year did not enroll to continue his/her studies. The purpose of this project is to propose models for predicting dropout and dropout situations for students in the state of Ceará, using social databases, school performance and mothers' records in the CVLI and Maria da Penha databases. Another purpose of the work is to determine which factors have the most impact on evasion and abandonment. Longitudinal data from the years 2012 to 2019 of school data obtained from the School Census were used to verify the situation of students who dropped out or dropped out. In total, 4 databases were used: School Census, SPAECE, CVLI and Maria da Penha. The procedures were carried out through the Postgresql database management system, SPSS Software and Weka. After pre- processing, cleaning and applying filters, the data were used for machine training and prediction verification for decision-making about possible situations of evasion and abandonment. The Multilayer Perceptron (MLP), Support Vector Machine (SVM) and Random Forest classifiers were used, Correlation based feature selection - CFS was also applied to find the best attributes for the study, with performance in Portuguese and Mathematics, ethnicity being selected as attributes. , teaching stage and the indicator of the mother's presence in bases of violence. The respective accuracies of 83.9%, 78.24% and 71.4% were achieved, which concludes that the MLP classifier obtained the best result. |
URI: | http://www.repositorio.ufc.br/handle/riufc/73132 |
Aparece nas coleções: | PPGEEC - SOBRAL - Dissertações defendidas na UFC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2023_dis_iagteles.pdf | TELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023. | 45,41 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.