Paste
Copy
Cut
Options
  • Pregunta: El archivo UniversalBank.csv contiene datos de 5000 clientes de Universal Bank. Los datos incluyen información demográfica del cliente (edad, ingresos, etc.), la relación del cliente con el banco (hipoteca, cuenta de valores, etc.) y la respuesta del cliente a la última campaña de préstamo personal (Préstamo Personal). Entre estos 5000 clientes, solo 480 (=

    El archivo UniversalBank.csv contiene datos de 5000 clientes de Universal Bank. Los datos incluyen información demográfica del cliente (edad, ingresos, etc.), la relación del cliente con el banco (hipoteca, cuenta de valores, etc.) y la respuesta del cliente a la última campaña de préstamo personal (Préstamo Personal). Entre estos 5000 clientes, solo 480 (= 9,6%) aceptaron el préstamo personal que se les ofreció en la campaña anterior. En este ejercicio, nos enfocamos en dos predictores: En línea (si el cliente es o no un usuario activo de los servicios bancarios en línea) y Tarjeta de crédito (CC abreviado a continuación) (el cliente tiene una tarjeta de crédito emitida por el banco), y el resultado Préstamo personal (préstamo abreviado a continuación). Divida los datos en conjuntos de entrenamiento (20 %) y validación (80 %).

    1. a) Cree una tabla dinámica para los datos de entrenamiento con En línea como variable de columna, CC como variable de fila y Préstamo como variable de fila secundaria. Los valores dentro de la tabla deben transmitir el conteo

    2. b) Considere la tarea de clasificar a un cliente que posee una tarjeta de crédito bancaria y está utilizando activamente los servicios de banca en línea. Mirando la tabla dinámica, ¿cuál es la probabilidad de que este cliente acepte la oferta de préstamo? [Esta es la probabilidad de aceptación del préstamo (Préstamo = 1) condicionada a tener una tarjeta de crédito bancaria (CC = 1) y ser un usuario activo de los servicios de banca en línea (En línea = 1)].

    3. c) Cree dos tablas dinámicas separadas para los datos de entrenamiento. Uno tendrá Préstamo (filas) en función de Online (columnas) y el otro tendrá Préstamo (filas) en función de CC.

    4. d) Calcule lo siguiente

      1. P(CC = 1 | Préstamo = 1) (la proporción de titulares de tarjetas de crédito entre el préstamo

        aceptantes)

      2. P(En línea = 1 | Préstamo = 1)

      3. P(Préstamo = 1) (la proporción de aceptantes de préstamos)

      4. P(CC = 1 | Préstamo = 0) v. P(En línea = 1 | Préstamo = 0) vi. P(Préstamo = 0)

    5. e) Utilice las cantidades calculadas anteriormente para calcular la probabilidad bayesiana ingenua P(Préstamo = 1 |

      CC = 1, En línea = 1).

    6. f) Compare este valor con el obtenido de la tabla dinámica en (b). cual es mas

      estimado exacto?

    7. g) ¿Cuáles de las entradas de esta tabla se necesitan para calcular P(Préstamo = 1 | CC = 1, En línea =

      1)? En R, ejecute Naive Bayes en los datos. Examine la salida del modelo en los datos de entrenamiento y encuentre la entrada que corresponde a P (Préstamo = 1 | CC = 1, En línea = 1). Compare esto con el número que obtuvo en (e).

  • Chegg Logo
    Esta pregunta aún no se resolvió!
    ¿No es lo que buscas?
    Envía tu pregunta a un experto en la materia.