Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/85475
Tipo: Dissertação
Título: Retenção na educação superior: uma investigação baseada em mineração de dados na UFC - Campus de Crateús
Autor(es): Silva, Gerlândia Alves da
Orientador: Araújo, Adriana Castro
Coorientador: Silva, José Wellington Franco da
Palavras-chave em português: Assistência estudantil;Políticas públicas;Mineração de dados
Palavras-chave em inglês: Student assistance;Public policies;Data mining;Academic failure
CNPq: CNPQ::CIENCIAS HUMANAS::CIENCIA POLITICA::POLITICAS PUBLICAS
Data do documento: 2026
Citação: SILVA, Gerlândia Alves. Retenção na educação superior: uma investigação baseada em mineração de dados na UFC - Campus de Crateús. 2026. 265 f. Dissertação (Mestrado em Políticas Públicas e Gestão da Educação Superior) - Mestrado Profissional em Políticas Públicas e Gestão da Educação Superior, Pró-Reitoria de Pesquisa e Pós-Graduação, Universidade Federal do Ceará, Fortaleza, 2026.
Resumo: A pesquisa estuda a permanência estudantil na Educação Superior. Analisam-se políticas educacionais brasileiras, a exemplo do Programa de Apoio a Planos de Reestruturação e Expansão das Universidades Federais, da Política Nacional de Assistência Estudantil e da Lei de Cotas que impulsionaram a democratização, o acesso e a permanência dos estudantes nas Instituições de Ensino Superior. No estudo verificam-se os desafios relacionados à conclusão da graduação no tempo regular e às desistências. Objetivou-se identificar os fatores associados à retenção discente nos cursos de graduação da Universidade Federal do Ceará — UFC. Neste estudo, realizado na UFC, campus Crateús, a Taxa de Sucesso da Graduação manteve-se, em dez anos, abaixo da média institucional, com baixos índices de diplomação e elevada retenção. A população investigada foi composta por 565 estudantes ingressantes entre 2016 e 2024, com matrícula ativa no semestre de 2025.2. Realizou-se uma pesquisa aplicada, descritiva e exploratória, com abordagem mista e triangulação de métodos. Os dados foram produzidos pela pesquisa documental e questionários. Na análise de dados, aplicaram-se as técnicas de Mineração de Dados, com o método de aprendizagem de máquina supervisionada para identificar padrões de retenção. Adotaram-se algoritmos da Árvore de Decisão, Random Forest, K-Nearest Neighbors, Regressão Logística e XGBoost, tendo como métricas de avaliação Acurácia, Precisão, Recall e F1-Score. Executou-se a validação cruzada (K= 10) integrada ao holdout de 80% para treinamento e 20% para teste. O Teste Estatístico de Wilcoxon indicou equivalência entre os modelos (p > 0,05), selecionando-se o KNN por apresentar Recall máximo igual a 1,00, com a Acurácia ≈ 0,60, Precisão ≈ 0,57 e F1-Score ≈ 0,72. Constatou-se que o modelo preditivo ainda não apresenta desempenho suficiente para aplicação imediata, demandando aprimoramentos adicionais antes de sua implementação. Contudo, o sistema DEYSI alcançou parcialmente seu objetivo nas etapas de extração, transformação e carregamento. Os resultados evidenciaram que 70,4% (398) dos estudantes encontram-se retidos e 29,5% (167) em situação regular. Entre os retidos, 74,0% (294) configuram-se em Retenção Crítica e 26,0% (104) em Retenção Moderada. Por área de conhecimento, o maior índice está nas Ciências Exatas e da Terra, 55,7% (222), enquanto as Engenharias apresentaram 44,2% (175). Conforme os discentes, são fatores associados à retenção: reprovações em disciplinas do ciclo básico, fragilidades na formação básica, escolha precoce do curso, estruturas curriculares extensas e rígidas, com alta densidade de pré-requisitos, resistência à flexibilização de quebras de pré-requisitos, limitações na oferta de disciplinas e insuficiência de auxílios e bolsas da assistência estudantil. Conclui-se que a retenção é um fenômeno multifatorial, demandando ações institucionais preventivas e contínuas, fortalecimento das estratégias existentes, ampliação do diálogo entre os segmentos acadêmicos e expansão das políticas de assistência estudantil.
Abstract: This study investigates student retention in higher education. It analyzes Brazilian educational policies, such as the Support Program for the Restructuring and Expansion Plans of Federal Universities (REUNI), the National Student Assistance Policy, and the Quota Law, which have fostered democratization, access, and student retention in higher education institutions. The study examines challenges related to completing undergraduate programs within the expected timeframe and student dropout. The objective was to identify factors associated with student retention in undergraduate programs at the Federal University of Ceará (UFC). Conducted at the UFC Crateús campus, the study found that the Graduation Success Rate remained below the institutional average over a ten-year period, with low graduation rates and high retention levels. The population consisted of 565 students admitted between 2016 and 2024, with active enrollment in the 2025.2 semester. This applied, descriptive, and exploratory study adopted a mixed-methods approach with methodological triangulation. Data were collected through document analysis and questionnaires. For data analysis, data mining techniques were employed using supervised machine learning methods to identify retention patterns. The algorithms applied included Decision Tree, Random Forest, K-Nearest Neighbors, Logistic Regression, and XGBoost, evaluated using Accuracy, Precision, Recall, and F1-score metrics. A cross-validation procedure (K = 10) combined with an 80/20 holdout split for training and testing was conducted. The Wilcoxon statistical test indicated no significant difference between the models (p > 0.05), and KNN was selected for presenting maximum Recall equal to 1.00, with Accuracy ≈ 0.60, Precision ≈ 0.57, and F1-score ≈ 0.72. However, the model does not yet demonstrate sufficient performance for immediate application, requiring further improvements before implementation. Nevertheless, the DEYSI system partially achieved its objective in the extraction, transformation, and loading stages. The results showed that 70.4% (398) of students were retained, while 29.5% (167) were in regular academic standing. Among the retained students, 74.0% (294) were classified as critical retention and 26.0% (104) as moderate retention. By field of study, the highest retention rate was observed in Exact and Earth Sciences (55.7%, 222 students), followed by Engineering (44.2%, 175 students). According to the students, the main factors associated with retention include failures in foundational courses, deficiencies in prior education, early choice of academic programs, rigid and extensive curricula with a high density of prerequisites, resistance to prerequisite flexibility, limited course offerings, and insufficient student assistance and financial aid. It is concluded that retention is a multifactorial phenomenon, requiring preventive and continuous institutional actions, strengthening of existing strategies, enhanced dialogue among academic stakeholders, and expansion of student assistance policies.
URI: http://repositorio.ufc.br/handle/riufc/85475
ORCID do(s) Autor(es): https://orcid.org/0009-0000-1215-7564
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/1559208577663927
ORCID do Orientador: https://orcid.org/0000-0001-7739-0471
Currículo Lattes do Orientador: http://lattes.cnpq.br/9105732661300720
ORCID do Coorientador: https://orcid.org/0000-0001-9093-0428
Currículo Lattes do Coorientador: http://lattes.cnpq.br/5168415467086883
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:POLEDUC - Dissertações defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2026_dis_gasilva.pdf5,04 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.