Paste
Copy
Cut
Options

¡Tu solución está lista!

Nuestra ayuda de expertos desglosó tu problema en una solución confiable y fácil de entender.

Mira la respuesta
  • Pregunta: Eres gerente en el departamento de servicio al cliente en Amazon. Diariamente, su equipo 100.000 correos electrónicos de clientes. Necesita desarrollar un modelo, que escanee esos correos electrónicos en dos categorías generales: quejas y aprobaciones. Las quejas deben enviarse a un departamento específico para que se encargue de ellas, ya sea reembolsando

    Eres gerente en el departamento de servicio al cliente en Amazon. Diariamente, su equipo 100.000 correos electrónicos de clientes. Necesita desarrollar un modelo, que escanee esos correos electrónicos en dos categorías generales: quejas y aprobaciones. Las quejas deben enviarse a un departamento específico para que se encargue de ellas, ya sea reembolsando al cliente u ofreciéndole algunas promociones... Las aprobaciones deben enviarse a otro departamento, para tratar de alentar a los clientes satisfechos a comprar más utilizando una variedad de técnicas. La aprobación se etiqueta como positiva y las quejas se etiquetan como negativas. Seguramente, comprende la importancia de leer esos correos electrónicos por una máquina y clasificarlos en la categoría correcta. Sin embargo, su modelo no es perfecto Por cada TN, en promedio, ganamos $ 10, por cada TP que hacemos, $ 8, y por cada FP perderemos $ 3 y por cada Fn, perderemos $ 12. Para su modelo, TN=20, TP=90, FN=15, FP=2. Todos los números están en millones. Para la construcción del modelo se han utilizado 127 observaciones de las cuales 110 fueron positivas A) ¿Qué métricas de rendimiento utilizará para este modelo? Las respuestas aceptadas son "exactitud", "precisión", "recordar" y "f1_score". Ingrese la respuesta en Q4/A que será la celda B6 de la hoja "resumen" B) Teniendo en cuenta el papel de los datos desequilibrados, ¿cuál es el valor esperado de este modelo? La respuesta a esta pregunta es un número. Ingréselo en Q4/B, que será la celda C6 de la hoja "resumen" C) Por cada correo electrónico, está pagando $0.1 a su científico de datos para hacer la predicción. Según el EV que tiene, ¿lo despedirá o lo ascenderá? Explicar por qué. Ingréselo en Q4/C, que será la celda D6 de la hoja "resumen".

  • Chegg Logo
    Esta es la mejor manera de resolver el problema.
    Solución

    A) El área bajo la curva (AUC) es una de las medidas más utilizadas para la evaluación. Se utiliza para la emisión de órdenes dobles. El AUC de un clasificador es equivalente a la probabilidad de que el clasificador clasifique un modelo positivo eleg

    Mira la respuesta completa
    answer image blur