Registro:
Documento: | Tesis de Maestría |
Título: | Modelo de predicción de compra de tarjeta de crédito |
Título alternativo: | Credit card purchase prediction model |
Autor: | Stivala, Ignacio José |
Editor: | Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
Publicación en la Web: | 2023-08-28 |
Fecha de defensa: | 2023-06-21 |
Fecha en portada: | 10/04/2023 |
Grado Obtenido: | Maestría |
Título Obtenido: | Magíster de la Universidad de Buenos Aires en el área de Estadística Matemática |
Departamento Docente: | Departamento de Matemáticas |
Director: | Rodríguez, Daniela Andrea |
Director Asistente: | Venturini, Ludmila V. |
Jurado: | Valdora, Marina Silvia; Martos Venturini, Gabriel; Solovey, Guillermo |
Idioma: | Español |
Palabras clave: | CLASIFICACION BINARIA; DESBALANCEO; SELECCION DE VARIABLES; REDUCCION DE DIMENSION; REGRESION LOGISTICA; PLS-DA; RANDOM FOREST; LIGHT GBM; SHAPBINARY CLASSIFICATION; IMBALANCE DATA; VARIABLE SELECTION; DIMENSION REDUCTION; LOGISTIC REGRESSION; PLS-DA; RANDOM FOREST; LIGHT GBM; SHAP |
Formato: | PDF |
Handle: |
http://hdl.handle.net/20.500.12110/tesis_n7343_Stivala |
PDF: | https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7343_Stivala.pdf |
Registro: | https://bibliotecadigital.exactas.uba.ar/collection/tesis/document/tesis_n7343_Stivala |
Ubicación: | EST 007343 |
Derechos de Acceso: | Esta obra puede ser leída, grabada y utilizada con fines de estudio, investigación y docencia. Es necesario el reconocimiento de autoría mediante la cita correspondiente. Stivala, Ignacio José. (2023). Modelo de predicción de compra de tarjeta de crédito. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales). Recuperado de http://hdl.handle.net/20.500.12110/tesis_n7343_Stivala |
Resumen:
El trabajo muestra el desarrollo completo de un modelo de clasificación binario, aplicado a un problema real dentro de la industria bancaria, que presenta gran cantidad de datos (2.380.000 registros y 1.400 variables) y gran desbalanceo (1,8 %). La variable respuesta es si el cliente compra o no una tarjeta de crédito, y el parámetro de interés la probabilidad de dicha compra. Se desarrolló en un contexto macro económico de alta inflación, requiriendo trabajar con variables monetarias. Las etapas desarrolladas son armado de base, limpieza y preprocesamiento, selección de variables/reducción de dimensión, aplicación de algoritmos, evaluación y selección del modelo final. Se utilizan diversas técnicas con el objetivo de obtener la mejor predicción: regresión logística, Lasso, Ridge, Partial Least Squares-Discriminant Analysis (PLS-DA), Random Forest, Gradient Boosting Tree y Light Gradient Boosting Machine (light GBM). Para la explicación de las variables se utilizan SHapley Additive exPlanations (SHAP). Además, se muestra un análisis que permite decidir si es conveniente trabajar con un modelo global o dos modelos distintos separando al universo por una variable independiente.
Abstract:
This work shows the complete development of a binary classification model, applied to a real problem in the banking industry, which presents a large amount of data (2,380,000 records and 1,400 variables) and a large imbalance (1.8 %). The response is whether or not the customer buys a credit card, and the interest variable is the probability of that purchase. It was developed in a macroeconomic context of high inflation, requiring work with monetary variables. The stages developed are collecting data, cleaning and preprocessing, variable selection/dimension reduction, application of algorithms, evaluation and selection of the final model. Various techniques are used in order to obtain the best prediction: logistic regression, Lasso, Ridge, Partial Least Squares-Discriminant Analysis (PLS-DA), Random Forest, Gradient Boosting Tree and Light Gradient Boosting Machine (light GBM). SHapley Additive exPlanations (SHAP) are used for the explanation of the variables. In addition, an analysis is shown that allows deciding if it is convenient to work with a global model or two different models splitting the universe by an independent variable.
Citación:
---------- APA ----------
Stivala, Ignacio José. (2023). Modelo de predicción de compra de tarjeta de crédito. (Tesis de Maestría. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.). Recuperado de https://hdl.handle.net/20.500.12110/tesis_n7343_Stivala
---------- CHICAGO ----------
Stivala, Ignacio José. "Modelo de predicción de compra de tarjeta de crédito". Tesis de Maestría, Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales, 2023.https://hdl.handle.net/20.500.12110/tesis_n7343_Stivala
Estadísticas:
Descargas totales desde :
Descargas mensuales
https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n7343_Stivala.pdf