Interpretabilidade de modelos de machine learning: aplicação no mercado de crédito

Araújo, João Paulo Bezerra de

Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/61901

Type:	TCC
Title:	Interpretabilidade de modelos de machine learning: aplicação no mercado de crédito
Authors:	Araújo, João Paulo Bezerra de
Advisor:	Braga, Arthur Plínio de Souza
Keywords:	Machine learning;Credit score;Regressão logística;Árvore de decisão;Gradient boosting machine;Multilayer perceptron
Issue Date:	2020
Citation:	ARAÚJO, João Paulo Bezerra de. Interpretabilidade de modelos de machine learning: aplicação no mercado de crédito. 2020. 71 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2020.
Abstract in Brazilian Portuguese:	No mercado de crédito é comum utilizar a informação disponível para estabelecer riscos de inadimplência de um cliente em potencial, e para se obter boa precisão estatística na predição desse risco são empregadas técnicas de machine learning com o objetivo de usar os dados na produção de um score, conhecido como score de crédito. Neste trabalho são avaliadas quatro técnicas - Regressão Logística, Árvore de Decisão, Gradient Boosting Machine e Multilayer Perceptron- no conceito de concessão de crédito, sob a ótica de interpretabilidade da construção do score e do desempenho. O objetivo é apresentar a forma como os modelos usam os dados para tomar as decisões e mostrar esta informação de forma coerente a terceiros, mesmo quando aplicado um modelo considerado "caixa-preta". Para finalizar, são gerados textos que justificam a composição do score atribuído a um cliente específico, de forma a observar sua coerência com a utilização no negócio.
Abstract:	In the credit market, it is common to use the information available to establish default risks for a potential customer, and to obtain good statistical accuracy in predicting this risk, machine learning techniques are employed in order to use the data in producing a score, known as a credit score. In this work, four techniques are evaluated - Logistic Regression, Decision Tree, Gradient Boosting Machine and Multilayer Perceptron - in the concept of credit granting, from the perspective of interpretability of the construction of the score and performance. The objective is to present the way the models use the data to make decisions and show this information in a coherent way to third parties, even when a model considered "black box" is applied. Finally, texts are generated that justify the composition of the score attributed to a specific customer, in order to observe its consistency with business usage.
URI:	http://www.repositorio.ufc.br/handle/riufc/61901
Aparece en las colecciones:	ENGENHARIA ELÉTRICA - Monografias

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
2020_tcc_jpbaraujo.pdf		2,59 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem