Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/70919
Tipo: | Dissertação |
Título: | Previsão da pobreza do Estado do Ceará |
Autor(es): | Silva, Angélica Caitano da |
Orientador: | Araujo, Jair Andrade de |
Coorientador: | Campêlo, Guaracyane Lima |
Palavras-chave: | Pobreza;Modelos de Predição;Machine Learning |
Data do documento: | 2022 |
Citação: | SILVA, A. C. Previsão da pobreza do Estado do Ceará. 2022. 77 f. Dissertação (Mestrado em Economia Rural) - Centro de Ciências Agrárias, Universidade Federal do Ceará, Fortaleza, 2022. |
Resumo: | Nas últimas décadas, é recorrente a análise da pobreza e dos seus determinantes com o principal intuito de entender o cenário dessa parcela da população que vive com uma renda insuficiente e até mesmo em condições de vida inaceitáveis. O acesso aos dados e às técnicas precisas e atualizadas sobre a pobreza é essencial para que os governos e formuladores de políticas identifiquem as áreas vulneráveis, permitindo-lhes obter conhecimento confiável por meio da ciência de dados. Este estudo utiliza a técnica de Machine Learning para fazer a previsão de pobreza com a base de dados da última Pesquisa de Orçamentos Familiares (POF) de 2017- 2018, em um recorte para o estado do Ceará. Estimam-se diversos modelos (Regressão Logística, LASSO e Regressão Linear). Dentre os métodos, o que teve maior acurácia foi o método LASSO. A Regressão logística teve maior AUC ROC. Entre as conclusões, é possível prever uma taxa de pobres classificados, corretamente de 80,5 % para o modelo logístico, e para LASSO 80,8%. Pode-se afirmar que 80% dos indivíduos da base de teste são pobres no estado do Ceará. Ambos os modelos finais tiveram variáveis de impacto parecidas, são elas: lixo, número de pessoas, número de crianças, parede, instrução, telhado, tipo de situação, sexo e idade. Esse resultado é importante, pois sabendo quais variáveis impactam diretamente, podese direcionar os investimentos nessas variáveis devido à importância para prever a pobreza no Ceará. |
Abstract: | In recent decades, poverty and its determinants have persisted in being analyzed, with the main aim of understanding the scenario of the portion of the population that lives with insufficient income and even in unacceptable living conditions. Access to accurate and up-to-date data and techniques on poverty is essential for governments and policymakers to identify vulnerable areas, allowing them to obtain reliable knowledge through data science. Anticipating poverty is essential so that governments can help in preventing the armed forces of poverty and promoting the reallocation of resources. This study uses the Machine Learning technique to make poverty forecasts based on data from the last Family Organization Survey (POF) from 2017-2018, in a record for the state of Ceará. Various models are estimated (Logistic Regressão, LASSO and Linear Regressão). Of these methods, the one that has the greatest accuracy was the method that was LASSO and the logistical regressão had the greatest AUC ROC. Among the conclusions, it is possible to foresee a correctly classified poor taxa of 80.5% for the logistic model, and for LASSO 80.8%. It can be affirmed that 80% of the individuals on the basis of the test will be poor in the State of Ceará. Both the final models have similar impact variables, they are: type, number of people, number of children, wall, instruction, roof, type of situation, sex and age. This assumption is important because knowing which variables have a direct impact, it is possible to direct the investments that vary because it is known how important they are to anticipate poverty in Ceará. |
URI: | http://www.repositorio.ufc.br/handle/riufc/70919 |
Tipo de Acesso: | Acesso Aberto |
Aparece nas coleções: | DEA - Dissertações defendidas na UFC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2022_dis_acsilva.pdf | 1,72 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.