Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/85994
Tipo: Dissertação
Título: Distorção idade-série no Brasil: uma abordagem preditiva com modelo XGBOOST
Autor(es): Porcino, Rafael Rocha
Orientador: França, João Mário Santos de
Coorientador: Campêlo, Guaracyane Lima
Palavras-chave em português: Distorção idade-série;Educação;Aprendizado de máquina;XGBoost;SHAP
Palavras-chave em inglês: Age-grade distortion;Education;Machine learning;XGBoost;SHAP
CNPq: CNPQ::CIENCIAS SOCIAIS APLICADAS::ECONOMIA
Data do documento: 2026
Citação: PORCINO, Rafael Rocha. Distorção idade-série no Brasil: uma abordagem preditiva com modelo XGBOOST. 2026. 38f. Dissertação (Mestrado em Economia do Setor Público) - Faculdade de Economia, Administração, Atuária e Contabilidade - FEAAC, Programa de Economia Profissional - PEP, Universidade Federal do Ceará - UFC, Fortaleza (CE), 2026.
Resumo: A distorção idade-série constitui um dos principais indicadores de vulnerabilidade educacional. Este estudo analisa os perfis de risco para a distorção idade-série entre crianças e adolescentes de 7 a 17 anos que frequentam a escola no Brasil. A distorção idade-série é definida pela defasagem de dois anos ou mais entre a idade cronológica do estudante e a série considerada adequada. A pesquisa utiliza microdados da PNAD Contínua de 2024 do IBGE com o modelo de aprendizado de máquina XGBoost (eXtreme Gradient Boosting) comparando seu desempenho com o modelo de regressão logística. Foram inseridas no modelo variáveis socioeconômicas, demográficas, territoriais, de infraestrutura domiciliar, insegurança alimentar e benefícios sociais. A análise revelou a superioridade preditiva do XGBoost frente à regressão logística, apresentando maior acurácia e sensibilidade na identificação de discentes em risco. Por meio dos valores SHAP (SHapley Additive exPlanations), identificou-se a idade como o principal preditor, com risco acentuado a partir dos 13 anos. Fatores como a inserção no mercado de trabalho, o sexo masculino e a baixa escolaridade do chefe do domicílio também se mostraram determinantes críticos. O estudo demonstra que algoritmos de machine learning superam métodos tradicionais na captura de padrões complexos, fornecendo um diagnóstico robusto para subsidiar políticas de permanência escolar.
Abstract: Age–grade distortion constitutes one of the main indicators of educational vulnerability. This study analyzes the risk profiles for age-grade distortion among children and adolescents aged 7 to 17 attending school in Brazil. Age-grade distortion is defined as a delay of two or more years between the student's chronological age and the appropriate grade. The research uses microdata from the 2024 IBGE Continuous PNAD, the XGBoost (eXtreme Gradient Boosting) machine learning model was employed, comparing its performance with the logistic regression model. Socioeconomic, demographic, territorial, household infrastructure, food insecurity, and social benefit variables were included in the model. The analysis revealed the predictive superiority of XGBoost over logistic regression, showing higher accuracy and sensitivity in identifying students at risk. Through SHAP (SHapley Additive exPlanations) values, age was identified as the main predictor, with risk accentuating from the age of 13. Factors such as labor market insertion, male gender, and low education level of the head of the household also proved to be critical determinants. The study demonstrates that machine learning algorithms outperform traditional methods in capturing complex patterns, providing a robust diagnosis to support school retention policies.
URI: http://repositorio.ufc.br/handle/riufc/85994
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/9069813515291094
Currículo Lattes do Orientador: http://lattes.cnpq.br/8959281661090118
Currículo Lattes do Coorientador: http://lattes.cnpq.br/9225005326955539
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:PEP - Dissertações defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2026_dis_rrporcino.pdf632,4 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.