LOGISTIC REGRESSION AND GENETIC ALGORITHMS APPLIED TO CREDIT RISK ANALYSIS
DOI:
https://doi.org/10.4270/ruc.20128Keywords:
Credit risk. Credit scoring models. Logistic regresion. Genetic algorithms.Abstract
The taking of decisions of credit concession is based basically on the evaluation of the insolvency risk of potential contractors of credit products. With the technological advance, statistical models have been developed to support the analysis of credit requests, which was many times carried through qualitatively some decades ago. The goal of this study is to present the use of logistic regression and genetic algorithms for sorting good and bad payers in bank financing and the identification of the best model in terms of goodness-of-fit. From a sample of 14,000 data, supplied by a great Brazilian financial institution, the two techniques were applied. Logistic regression presented the best goodness-of-fit. This work illustrated the procedures to be adopted by a company to identify the best model of credit concession, from which it is possible to direct the strategy of the institution in the evaluation process of bank loan requests.
Downloads
References
ABDOU, H. A. Genetic programming for credit scoring: the case of Egyptian public sector banks. Expert Systems with Applications, v. 36, n. 9, p. 11402-11417, nov. 2009. http://dx.doi.org/10.1016/j.eswa.2009.01.076
ANDREEVA, G. European generic scoring models using logistic regression and survival analysis. In: YOUNG OR CONFERENCE, 2003, Bath. Anais… Bath: Young OR, 2003.
ARMINGER, G.; ENACHE, D.; BONNE, T. Analyzing credit risk data: a comparison of logistic discrimination, classification trees and feedforward networks. Computational Statistics, Berlim, v. 12, n.2, p. 293-310, 1997.
BACK, B.; LAITINEN, T.; SERE, K. Neural networks and genetic algorithms for bankruptcy predictions. In: WORLD CONFERENCE ON EXPERT SYSTEMS, 3., Seul. Anais… Seul: Science Direct, 1996. http://dx.doi.org/10.1016/S0957-4174(96)00055-3
BIJAK, K.; THOMAS, L. C. Does segmentation always improve model performance in credit scoring? Expert Systems with Applications, v. 39, n. 3, p. 2433-2442, fev. 2012. http://dx.doi.org/10.1016/j.eswa.2011.08.093
BRITO, G. A. S.; ASSAF NETO, A. Modelo de classificação de risco de crédito de empresas. Revista Contabilidade & Finanças, v. 19, n. 46, p. 18-29, abr. 2008. http://dx.doi.org/10.1590/S1519-70772008000100003
BROWN, I.; MUES, C. An experimental comparison of classification algorithms for imbalanced credit scoring data sets. Expert Systems with Applications, v. 39, n. 3, p. 3446-3453, fev. 2012. http://dx.doi.org/10.1016/j.eswa.2011.09.033
CHEN, M. C.; HUANG, S. H; CHEN, C. M. Credit classification analysis through the genetic programming approach. In: INTERNATIONAL CONFERENCE IN INFORMATION MANAGEMENT, 2002, Taipei. Anais… Taipei: Tamkang University, 2002.
CHEN, M. C.; HUANG, S. H. Credit scoring and rejected instances reassigning through evolutionary computation techniques. Expert Systems with Applications, St. Louis, v. 24, n. 4, p. 433-441, 2003. http://dx.doi.org/10.1016/S0957-4174(02)00191-4
FIDELIS, M. V.; LOPES, H. S.; FREITAS, A. A. Discovering comprehensible classification rules with a genetic algorithm. In: CONGRESS ON EVOLUTIONARY COMPUTATION, 2000, La Jolla. Anais... La Jolla: IEEE, 2000. http://dx.doi.org/10.1109/CEC.2000.870381
HAIR JR., J. F.; BLACK, W. C.; BABIN, B. J.; ANDERSON, R. E.; TATHAM, R. L. Análise multivariada de dados. São Paulo: Bookman, 2009.
HAND, D. J.; HENLEY, W. E. Statistical classification methods in consumer credit scoring: a review. Journal of Royal Statistical Society, London, v. 160, p. 523-541, 1997. http://dx.doi.org/10.1111/j.1467-985X.1997.00078.x
HARRISON, T.; ANSELL, J. Customer retention in the insurance industry: using survival analysis to predict cross-selling opportunities. Journal of Financial Services Marketing, London, v. 6, n. 3, p. 229-239, 2002. http://dx.doi.org/10.1057/palgrave.fsm.4770054
KISHORE, J. K.; PATNAIK, L. M.; MANI, V.; AGRAWAL, V. K. Application of genetic programming for multicategory pattern classification. IEEE Transactions on Evolutionary Computation, Birmingham, v. 4, n. 3, p. 242-257, 2000. http://dx.doi.org/10.1109/4235.873235
LEWIS, E. M. An introduction to credit scoring. San Rafael: Fair Isaac and Co., Inc, 1992.
LIMA, F. G.; PERERA, L. C. J.; KIMURA, H.; SILVA FILHO, A. C. Aplicação de redes neurais na análise e na concessão de crédito ao consumidor. Revista de Administração da USP, São Paulo, v. 44, n. 1, p. 34-45, 2009.
MAVRI, M.; ANGELIS, V.; IOANNOU, G.; GAKI, E.; KOUFODONTIS, I. A two-stage dynamic credit scoring model, based on customers’ profile and time horizon. Journal of Financial Services Marketing, v. 13, n. 1, p. 17-27, maio, 2008. http://dx.doi.org/10.1057/fsm.2008.2
OHTOSHI, C. Uma comparação de regressão logística, árvores de classificação e redes neurais: analisando dados de crédito. 2003. Dissertação (Mestrado em Estatística) – Programa de Pós-graduação em Estatística, Instituto de Matemática e Estatística da Universidade de São Paulo, São Paulo, 2003.
OOGHE, H.; CAMERLYNCK, J.; BALCAEN, S. The Ooghe-Joos-De Vos failure prediction models: a cross-industry validation. Brussels Economic Review, v. 46, p. 39-70, 2003.
PAPPA, G. L. Seleção de atributos utilizando algoritmos genéticos multiobjetivos. 2002. Dissertação (Mestrado em Informática) – Programa de Pós-graduação em Informática, Pontifícia Universidade do Paraná, Curitiba, 2002.
PEREIRA, G. H. A. Modelos de risco de crédito de clientes: uma aplicação a dados reais. 2004. Dissertação (Mestrado em Estatística) – Programa de Pós-graduação em Estatística, Instituto de Matemática e Estatística da Universidade de São Paulo, São Paulo, 2004.
PICININI, R., OLIVEIRA, G. M. B.; MONTEIRO, L. H. A. Mineração de critério de credit scoring utilizando algoritmos genéticos. In: SIMPÓSIO BRASILEIRO DE AUTOMAÇÃO INTELIGENTE, 6., 2003, Bauru. Anais... Bauru: Universidade de Brasília, 2003.
ROSA, P. T. M. Modelos de Credit Scoring: Regressão Logística, CHAID e REAL. 2000. Dissertação (Mestrado em Estatística) – Programa de Pós-graduação em Estatística, Instituto de Matemática e Estatística da Universidade de São Paulo, São Paulo, 2000.
SEMOLINI, R. Support vector machines, inferência transdutiva e o problema de classificação. 2002. Dissertação (Mestrado em Engenharia Elétrica) – Programa de Pós-graduação em Engenharia Elétrica, Faculdade de Engenharia Elétrica e de Computação da Universidade Estadual de Campinas, Campinas, 2002.
SIEGEL, S. Estatística não-paramétrica para as ciências do comportamento. São Paulo: McGraw-Hill, 1975.
SILVA, S. F. Seleção de características por meio de algoritmos genéticos para aprimoramento de rankings e de modelos de classificação. 2011. 115f. Tese (Doutorado em Estatística) – Instituto de Matemática e Estatística, Universidade de São Paulo, São Paulo, 2011.
ŠUŠTERŠIČ, M.; MRAMOR, D.; ZUPAN, J. Consumer credit scoring models with limited data. Expert Systems with Applications, v. 36, n. 3, p. 4736-4744, abr. 2009. http://dx.doi.org/10.1016/j.eswa.2008.06.016
TREVISANI, A. T., GONÇALVES, E. B., D’EMÍDIO, M.; HUMES, L. L. Qualidade de dados: desafio crítico para o sucesso do business intelligence. In: CONGRESSO LATINO AMERICANO DE ESTRATÉGIA, 18., 2004, Itajaí. Anais... Itajaí: Sociedade Latinoamericana de Estratégia, 2004.
ULISES, C.; CARMONA, D. M. Application of credit scoring models in the analysis of insolvency of a Brazilian microcredit institution. Journal of Modern Accounting and Auditing, v. 7, n. 8, p. 799-812, 2011.
YAP, B. W.; ONG, S. H.; HUSAIN, N. H. M. Using data mining to improve assessment of credit worthiness via credit scoring models. Expert Systems with Applications, v. 38, n. 10, p. 13274-13283, set 2011. http://dx.doi.org/10.1016/j.eswa.2011.04.147
Published
How to Cite
Issue
Section
License
The copyright for papers published in this journal belong to the author, with rights of first publication for the journal. As the papers appears in this publicly accessed journal, the papers are for free use, receiving their credit, in educational and non-commercial uses. The journal will allow the use of the papers published for non-commercial purposes, including the right to send the paper to publicly accessed databases.