Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/83510
Type: Dissertação
Title: Machine Learning interpretável na avaliação de imóveis em massa: aplicação do SHAP
Authors: Távora, Victor Jucá
Advisor: Carneiro, Diego Rafael Fonseca
Keywords in Brazilian Portuguese : Avaliação em massa;Aprendizagem de máquinas;SHAP
Keywords in English : Mass appraisal;Machine learning;SHAP
Knowledge Areas - CNPq: CNPQ::CIENCIAS SOCIAIS APLICADAS::ECONOMIA
Issue Date: 2025
Citation: TÁVORA, Victor Jucá. Machine Learning interpretável na avaliação de imóveis em massa: aplicação do SHAP. 2025. 64f. Dissertação (Mestrado em Economia do Setor Público) - Faculdade de Economia, Administração, Atuária e Contabilidade - FEAAC, Programa de Economia Profissional - PEP, Universidade Federal do Ceará - UFC, Fortaleza (CE), 2025.
Abstract in Brazilian Portuguese: Este trabalho tem como objetivo avançar com o emprego de algoritmos de machine learning no contexto de avaliações de imóveis em massa, ao explorar e validar ferramentas que se prestam a tornar esses modelos mais interpretáveis e explicáveis. Utilizando uma amostra de 6.660 apartamentos do município de Fortaleza/CE, provenientes da Secretaria Municipal das Finanças, comparou-se o modelo tradicional de regressão linear múltipla com os algoritmos XGBoost e Random Forest. O XGBoost apresentou o melhor desempenho em todas as métricas avaliadas (MAPE, RMSE, R², COD e PRD). Para lidar com o desafio de interpretabilidade, aplicou-se a técnica SHAP (Shapley Additive Explanations), que permite analisar a contribuição individual de cada variável e compreender, de forma global, as relações capturadas pelo modelo. A comparação entre gráficos de dependência parcial do modelo clássico e do XGBoost, elaborados com a biblioteca SHAP, mostrou que este capturou uma relação não linear entre idade e preço unitário, além da interação entre idade e renda. Também se pôde observar a diversidade de efeitos em variáveis dicotômicas. A análise local revelou que a contribuição das variáveis varia significativamente entre imóveis de diferentes contextos. A técnica SHAP demonstrou-se útil para promover transparência e facilitar a compreensão dos modelos por técnicos e gestores públicos, contribuindo para a justiça fiscal e a comunicação com os contribuintes. A visualização por meio de waterfall plots mostrou-se eficaz para apresentar predições individuais sem exigir conhecimento aprofundado sobre os algoritmos. O estudo reforça a viabilidade do uso de inteligência artificial interpretável em avaliações fiscais e propõe sua adoção para fortalecer e ampliar o uso de algoritmos baseados em árvore no contexto tributário.
Abstract: This study aims to advance the use of machine learning algorithms in mass real estate appraisal context by exploring and validating tools designed to enhance model interpretability and explainability. Using a dataset of 6,660 apartments from Fortaleza, Brazil, provided by the Municipal Finance Department, the performance of a traditional multiple linear regression model was compared with that of modern machine learning algorithms, namely XGBoost and Random Forest. XGBoost achieved the best performance across all evaluated metrics (MAPE, RMSE, R², COD, and PRD). To address the challenge of interpretability, SHAP (Shapley Additive Explanations) method was employed, enabling the assessment of each variable’s individual contribution and a global understanding of relationships captured by the model. Comparison between partial dependence plots from the classical model and SHAP-based plots for XGBoost revealed a non-linear relationship between building age and unit price, as well as an interaction between age and neighborhood income levels. Diverse effects were also observed in binary variables. The local analysis showed that the influence of predictors varies substantially across properties with different characteristics. SHAP proved valuable for enhancing transparency and improving model interpretability for both technical and public administration purposes, contributing to greater tax fairness and better communication with taxpayers. Waterfall plots, in particular, demonstrated effectiveness in explaining individual predictions without requiring in-depth technical knowledge of the algorithms. This study highlights the feasibility of integrating explainable artificial intelligence into fiscal mass appraisal workflows and recommends its adoption to strengthen and expand the use of tree-based algorithms in property taxation.
URI: http://repositorio.ufc.br/handle/riufc/83510
Author's Lattes: http://lattes.cnpq.br/7391064009394582
Advisor's Lattes: http://lattes.cnpq.br/4199618744331611
Access Rights: Acesso Aberto
Appears in Collections:PEP - Dissertações defendidas na UFC

Files in This Item:
File Description SizeFormat 
2025_dis_vjtavora.pdf1,76 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.