Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/85994
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorFrança, João Mário Santos de-
dc.contributor.authorPorcino, Rafael Rocha-
dc.date.accessioned2026-04-24T15:34:56Z-
dc.date.available2026-04-24T15:34:56Z-
dc.date.issued2026-
dc.identifier.citationPORCINO, Rafael Rocha. Distorção idade-série no Brasil: uma abordagem preditiva com modelo XGBOOST. 2026. 38f. Dissertação (Mestrado em Economia do Setor Público) - Faculdade de Economia, Administração, Atuária e Contabilidade - FEAAC, Programa de Economia Profissional - PEP, Universidade Federal do Ceará - UFC, Fortaleza (CE), 2026.pt_BR
dc.identifier.urihttp://repositorio.ufc.br/handle/riufc/85994-
dc.description.abstractAge–grade distortion constitutes one of the main indicators of educational vulnerability. This study analyzes the risk profiles for age-grade distortion among children and adolescents aged 7 to 17 attending school in Brazil. Age-grade distortion is defined as a delay of two or more years between the student's chronological age and the appropriate grade. The research uses microdata from the 2024 IBGE Continuous PNAD, the XGBoost (eXtreme Gradient Boosting) machine learning model was employed, comparing its performance with the logistic regression model. Socioeconomic, demographic, territorial, household infrastructure, food insecurity, and social benefit variables were included in the model. The analysis revealed the predictive superiority of XGBoost over logistic regression, showing higher accuracy and sensitivity in identifying students at risk. Through SHAP (SHapley Additive exPlanations) values, age was identified as the main predictor, with risk accentuating from the age of 13. Factors such as labor market insertion, male gender, and low education level of the head of the household also proved to be critical determinants. The study demonstrates that machine learning algorithms outperform traditional methods in capturing complex patterns, providing a robust diagnosis to support school retention policies.pt_BR
dc.language.isopt_BRpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleDistorção idade-série no Brasil: uma abordagem preditiva com modelo XGBOOSTpt_BR
dc.typeDissertaçãopt_BR
dc.contributor.co-advisorCampêlo, Guaracyane Lima-
dc.description.abstract-ptbrA distorção idade-série constitui um dos principais indicadores de vulnerabilidade educacional. Este estudo analisa os perfis de risco para a distorção idade-série entre crianças e adolescentes de 7 a 17 anos que frequentam a escola no Brasil. A distorção idade-série é definida pela defasagem de dois anos ou mais entre a idade cronológica do estudante e a série considerada adequada. A pesquisa utiliza microdados da PNAD Contínua de 2024 do IBGE com o modelo de aprendizado de máquina XGBoost (eXtreme Gradient Boosting) comparando seu desempenho com o modelo de regressão logística. Foram inseridas no modelo variáveis socioeconômicas, demográficas, territoriais, de infraestrutura domiciliar, insegurança alimentar e benefícios sociais. A análise revelou a superioridade preditiva do XGBoost frente à regressão logística, apresentando maior acurácia e sensibilidade na identificação de discentes em risco. Por meio dos valores SHAP (SHapley Additive exPlanations), identificou-se a idade como o principal preditor, com risco acentuado a partir dos 13 anos. Fatores como a inserção no mercado de trabalho, o sexo masculino e a baixa escolaridade do chefe do domicílio também se mostraram determinantes críticos. O estudo demonstra que algoritmos de machine learning superam métodos tradicionais na captura de padrões complexos, fornecendo um diagnóstico robusto para subsidiar políticas de permanência escolar.pt_BR
dc.subject.ptbrDistorção idade-sériept_BR
dc.subject.ptbrEducaçãopt_BR
dc.subject.ptbrAprendizado de máquinapt_BR
dc.subject.ptbrXGBoostpt_BR
dc.subject.ptbrSHAPpt_BR
dc.subject.enAge-grade distortionpt_BR
dc.subject.enEducationpt_BR
dc.subject.enMachine learningpt_BR
dc.subject.enXGBoostpt_BR
dc.subject.enSHAPpt_BR
dc.subject.cnpqCNPQ::CIENCIAS SOCIAIS APLICADAS::ECONOMIApt_BR
local.author.latteshttp://lattes.cnpq.br/9069813515291094pt_BR
local.advisor.latteshttp://lattes.cnpq.br/8959281661090118pt_BR
local.co-advisor.latteshttp://lattes.cnpq.br/9225005326955539pt_BR
Aparece nas coleções:PEP - Dissertações defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2026_dis_rrporcino.pdf632,4 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.