Paste
Copy
Cut
Options

¡Tu solución está lista!

Nuestra ayuda de expertos desglosó tu problema en una solución confiable y fácil de entender.

Mira la respuesta
  • Pregunta: Necesito ayuda para entender cómo modelar este problema en Microsoft Excel. Trabaja para un banco como analista de datos comerciales en el departamento de modelado de riesgos de tarjetas de crédito. Su banco realizó recientemente un experimento audaz: durante un breve intervalo de tiempo hace tres años, emitió silenciosamente 600 tarjetas de crédito a todos

    Necesito ayuda para entender cómo modelar este problema en Microsoft Excel. Trabaja para un banco como analista de datos comerciales en el departamento de modelado de riesgos de tarjetas de crédito. Su banco realizó recientemente un experimento audaz: durante un breve intervalo de tiempo hace tres años, emitió silenciosamente 600 tarjetas de crédito a todos los que solicitaron, independientemente de su riesgo crediticio. Después de tres años, 150, o el 25%, de los destinatarios de las tarjetas incumplieron: no pagaron al menos parte del dinero que debían. Sin embargo, el banco recopiló datos de propiedad muy valiosos que ahora puede utilizar para optimizar su futuro proceso de emisión de tarjetas. El banco recopiló inicialmente seis datos sobre cada persona. Edad Años en el empleador actual Años en la dirección actual Ingresos durante el último año Deuda actual de la tarjeta de crédito y Deuda actual del automóvil Primero se le pide que proponga un modelo de clasificación binaria para incumplimiento que use solo datos de una o más de las seis entradas anteriores y genere una sola "puntuación". El orden de rango relativo de las puntuaciones determinará la eficacia del modelo. Para mayor comodidad, se le pide que utilice una escala para su puntuación que tenga un máximo < 3,5 y un mínimo > -3,5. Inicialmente, no se le informa cuál es la mejor estimación del banco para el costo por Falso Negativo (solicitante aceptado que se convierte en cliente moroso) y Falso Positivo (cliente rechazado que no habría incumplido). Por lo tanto, lo mejor que puede hacer es diseñar un modelo que maximice el Área bajo la curva ROC o AUC. Se le dice que si su modelo es efectivo (AUC lo suficientemente alto, no definido) y "robusto" (no definido, pero en general significa un cambio relativamente pequeño en el AUC a través de múltiples conjuntos de datos disponibles), el banco puede adoptarlo como un modelo predictivo de incumplimiento, para determinar a qué futuros solicitantes se les emitirán tarjetas de crédito. Primer modelo de clasificación binaria: primero se le proporciona un "conjunto de entrenamiento" de 200 de las 600 personas en el experimento. Diseña tu modelo en este set. Estandarice sus datos primero. Puede combinar las seis entradas sumándolas o restándolas entre sí, tomando proporciones simples, etc. La única restricción es que su "puntuación" final debe escalarse para que el máximo sea inferior a 3,5 y el mínimo sea superior a -3,5, por lo que puede utilizar la "Calculadora AUC" de Excel proporcionada. Pregunta 1: ¿Cuál es tu modelo? Délo como una función de las dos o más de las seis entradas que generan una sola puntuación numérica entre -3,5 y 3,5 para cada solicitante Pregunta 2: ¿Cuál es el AUC de su modelo en el conjunto de entrenamiento?

  • Chegg Logo
    Hay 3 pasos para resolver este problema.
    Solución
    Paso 1

    Primeros comentarios

    Por comodidad, definamos las siguientes variables

    • x1 : Edad

    Mira la respuesta completa
    answer image blur
    Paso 2
    Desbloquea
    Paso 3
    Desbloquea
    Respuesta
    Desbloquea