Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/61901
Type: | TCC |
Title: | Interpretabilidade de modelos de machine learning: aplicação no mercado de crédito |
Authors: | Araújo, João Paulo Bezerra de |
Advisor: | Braga, Arthur Plínio de Souza |
Keywords: | Machine learning;Credit score;Regressão logística;Árvore de decisão;Gradient boosting machine;Multilayer perceptron |
Issue Date: | 2020 |
Citation: | ARAÚJO, João Paulo Bezerra de. Interpretabilidade de modelos de machine learning: aplicação no mercado de crédito. 2020. 71 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2020. |
Abstract in Brazilian Portuguese: | No mercado de crédito é comum utilizar a informação disponível para estabelecer riscos de inadimplência de um cliente em potencial, e para se obter boa precisão estatística na predição desse risco são empregadas técnicas de machine learning com o objetivo de usar os dados na produção de um score, conhecido como score de crédito. Neste trabalho são avaliadas quatro técnicas - Regressão Logística, Árvore de Decisão, Gradient Boosting Machine e Multilayer Perceptron- no conceito de concessão de crédito, sob a ótica de interpretabilidade da construção do score e do desempenho. O objetivo é apresentar a forma como os modelos usam os dados para tomar as decisões e mostrar esta informação de forma coerente a terceiros, mesmo quando aplicado um modelo considerado "caixa-preta". Para finalizar, são gerados textos que justificam a composição do score atribuído a um cliente específico, de forma a observar sua coerência com a utilização no negócio. |
Abstract: | In the credit market, it is common to use the information available to establish default risks for a potential customer, and to obtain good statistical accuracy in predicting this risk, machine learning techniques are employed in order to use the data in producing a score, known as a credit score. In this work, four techniques are evaluated - Logistic Regression, Decision Tree, Gradient Boosting Machine and Multilayer Perceptron - in the concept of credit granting, from the perspective of interpretability of the construction of the score and performance. The objective is to present the way the models use the data to make decisions and show this information in a coherent way to third parties, even when a model considered "black box" is applied. Finally, texts are generated that justify the composition of the score attributed to a specific customer, in order to observe its consistency with business usage. |
URI: | http://www.repositorio.ufc.br/handle/riufc/61901 |
Appears in Collections: | ENGENHARIA ELÉTRICA - Monografias |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2020_tcc_jpbaraujo.pdf | 2,59 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.