Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/86113
Tipo: Tese
Título: Eficiência técnica em assentamentos rurais do Ceará: análise envoltória de dados, clusters e aprendizado de máquina
Autor(es): Araújo, Francisco Nilson Silva
Orientador: Lima, Filipe Augusto Xavier
Palavras-chave em português: Agrupamento;Desenvolvimento rural;Reforma agrária;Produtividade;Semiárido
Palavras-chave em inglês: Clustering;Rural development;Agrarian reform;Productivity;Semi-arid
CNPq: CNPQ::CIENCIAS SOCIAIS APLICADAS
Data do documento: Abr-2026
Citação: ARAÚJO, Francisco Nilson Silva. Eficiência técnica em assentamentos rurais do Ceará: análise envoltória de dados, clusters e aprendizado de máquina. 2026. 117 f. Tese (doutorado em Economia Rural) - Universidade Federal do Ceará, Centro de Ciências Agrárias, Programa de Pós-Graduação em Economia Rural, Fortaleza, 2026
Resumo: O objetivo desta tese é analisar a eficiência técnica das unidades produtivas familiares em assentamentos rurais do estado do Ceará, buscando identificar seus determinantes e propor recomendações para a sustentabilidade desses territórios. Para tal, empregou-se uma abordagem metodológica quantitativa, relacionando a Análise Envoltória de Dados (DEA), a análise de cluster (K-means) e algoritmos de aprendizado de máquina (Random Forest, SVM e XGBoost). A pesquisa utilizou dados secundários de 923 lotes presentes em 16 Projetos de Assentamento (PAs), distribuídos em dez municípios. Esses dados também foram explorados de forma qualitativa, visando a uma caracterização socioeconômica e produtiva dos assentamentos que compõem a amostra. Os resultados da DEA revelaram notória heterogeneidade no desempenho, com 60% dos municípios operando na fronteira de eficiência e 40% apresentando ineficiências de até 26,2%. A análise de cluster segmentou os municípios em três perfis distintos (pequeno, médio e grande porte), validando a diversidade de contextos produtivos. Os modelos de aprendizado de máquina demonstraram alta capacidade preditiva, com o Random Forest alcançando 89,7% de acurácia na classificação de eficiência e o XGBoost explicando 80,7% da variação no escore de eficiência (R²). A área cultivada com milho emergiu como o preditor mais importante, seguida pelo acesso à água e pela diversificação para a pecuária (aves, bovinos e suínos), que se mostraram fatores críticos para o sucesso produtivo. Conclui-se que a sustentabilidade dos assentamentos está intrinsecamente ligada ao aumento da eficiência técnica, a qual, por sua vez, depende da superação de déficits socioeconômicos, como a falta de infraestrutura hídrica. A simples posse da terra mostra-se insuficiente sem investimentos complementares. Os achados da pesquisa fornecem subsídios para a formulação de políticas públicas customizadas, com recomendações específicas para cada perfil de município, visando promover um desenvolvimento rural mais justo, resiliente e produtivo no Semiárido cearense.
Abstract: The objective of this thesis is to analyze the technical efficiency of family-run production units in rural settlements in the state of Ceará, seeking to identify its determinants and propose recommendations for the sustainability of these territories. To this end, a quantitative methodological approach was employed, relating Data Envelopment Analysis (DEA), cluster analysis (K-means), and machine learning algorithms (Random Forest, SVM, and XGBoost). The research used secondary data from 923 plots present in 16 Settlement Projects (PAs), distributed across ten municipalities. This data was also explored qualitatively, aiming at a socioeconomic and productive characterization of the settlements that comprise the sample. The DEA results revealed notable heterogeneity in performance, with 60% of the municipalities operating on the efficiency frontier and 40% presenting inefficiencies of up to 26.2%. The cluster analysis segmented the municipalities into three distinct profiles (small, medium, and large), validating the diversity of productive contexts. Machine learning models demonstrated high predictive capacity, with Random Forest achieving 89.7% accuracy in efficiency classification and XGBoost explaining 80.7% of the variation in efficiency score (R²). The area cultivated with corn emerged as the most important predictor, followed by access to water and diversification for livestock (poultry, cattle, and swine), which proved to be critical factors for productive success. It is concluded that the sustainability of settlements is intrinsically linked to increased technical efficiency, which, in turn, depends on overcoming socioeconomic deficits, such as the lack of water infrastructure. The mere possession of land proves insufficient without complementary investments. The research findings provide support for the formulation of customized public policies, with specific recommendations for each municipality profile, aiming to promote fairer, more resilient, and productive rural development in the semi-arid region of Ceará.
URI: http://repositorio.ufc.br/handle/riufc/86113
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/4805313259673778
ORCID do Orientador: https://orcid.org/0000-0003-4235-1311
Currículo Lattes do Orientador: http://lattes.cnpq.br/6333811948672580
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:DEA - Teses defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2026_tese_fnsaraújo.pdf4,71 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.