Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/85994| Tipo: | Dissertação |
| Título: | Distorção idade-série no Brasil: uma abordagem preditiva com modelo XGBOOST |
| Autor(es): | Porcino, Rafael Rocha |
| Orientador: | França, João Mário Santos de |
| Coorientador: | Campêlo, Guaracyane Lima |
| Palavras-chave em português: | Distorção idade-série;Educação;Aprendizado de máquina;XGBoost;SHAP |
| Palavras-chave em inglês: | Age-grade distortion;Education;Machine learning;XGBoost;SHAP |
| CNPq: | CNPQ::CIENCIAS SOCIAIS APLICADAS::ECONOMIA |
| Data do documento: | 2026 |
| Citação: | PORCINO, Rafael Rocha. Distorção idade-série no Brasil: uma abordagem preditiva com modelo XGBOOST. 2026. 38f. Dissertação (Mestrado em Economia do Setor Público) - Faculdade de Economia, Administração, Atuária e Contabilidade - FEAAC, Programa de Economia Profissional - PEP, Universidade Federal do Ceará - UFC, Fortaleza (CE), 2026. |
| Resumo: | A distorção idade-série constitui um dos principais indicadores de vulnerabilidade educacional. Este estudo analisa os perfis de risco para a distorção idade-série entre crianças e adolescentes de 7 a 17 anos que frequentam a escola no Brasil. A distorção idade-série é definida pela defasagem de dois anos ou mais entre a idade cronológica do estudante e a série considerada adequada. A pesquisa utiliza microdados da PNAD Contínua de 2024 do IBGE com o modelo de aprendizado de máquina XGBoost (eXtreme Gradient Boosting) comparando seu desempenho com o modelo de regressão logística. Foram inseridas no modelo variáveis socioeconômicas, demográficas, territoriais, de infraestrutura domiciliar, insegurança alimentar e benefícios sociais. A análise revelou a superioridade preditiva do XGBoost frente à regressão logística, apresentando maior acurácia e sensibilidade na identificação de discentes em risco. Por meio dos valores SHAP (SHapley Additive exPlanations), identificou-se a idade como o principal preditor, com risco acentuado a partir dos 13 anos. Fatores como a inserção no mercado de trabalho, o sexo masculino e a baixa escolaridade do chefe do domicílio também se mostraram determinantes críticos. O estudo demonstra que algoritmos de machine learning superam métodos tradicionais na captura de padrões complexos, fornecendo um diagnóstico robusto para subsidiar políticas de permanência escolar. |
| Abstract: | Age–grade distortion constitutes one of the main indicators of educational vulnerability. This study analyzes the risk profiles for age-grade distortion among children and adolescents aged 7 to 17 attending school in Brazil. Age-grade distortion is defined as a delay of two or more years between the student's chronological age and the appropriate grade. The research uses microdata from the 2024 IBGE Continuous PNAD, the XGBoost (eXtreme Gradient Boosting) machine learning model was employed, comparing its performance with the logistic regression model. Socioeconomic, demographic, territorial, household infrastructure, food insecurity, and social benefit variables were included in the model. The analysis revealed the predictive superiority of XGBoost over logistic regression, showing higher accuracy and sensitivity in identifying students at risk. Through SHAP (SHapley Additive exPlanations) values, age was identified as the main predictor, with risk accentuating from the age of 13. Factors such as labor market insertion, male gender, and low education level of the head of the household also proved to be critical determinants. The study demonstrates that machine learning algorithms outperform traditional methods in capturing complex patterns, providing a robust diagnosis to support school retention policies. |
| URI: | http://repositorio.ufc.br/handle/riufc/85994 |
| Currículo Lattes do(s) Autor(es): | http://lattes.cnpq.br/9069813515291094 |
| Currículo Lattes do Orientador: | http://lattes.cnpq.br/8959281661090118 |
| Currículo Lattes do Coorientador: | http://lattes.cnpq.br/9225005326955539 |
| Tipo de Acesso: | Acesso Aberto |
| Aparece nas coleções: | PEP - Dissertações defendidas na UFC |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| 2026_dis_rrporcino.pdf | 632,4 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.