Paste
Copy
Cut
Options

¡Tu solución está lista!

Nuestra ayuda de expertos desglosó tu problema en una solución confiable y fácil de entender.

Mira la respuesta
  • Pregunta: Antecedentes Eres un científico de datos en Airbnb a cargo de analizar los datos sobre tus listados de alquiler. Te estás preparando para los análisis haciendo una limpieza y preparación menores. Tareas Usando el conjunto de datos disponible a continuación, completa cada una de las tareas que encuentres en las preguntas. 1. Importa los datos que se

    Antecedentes Eres un científico de datos en Airbnb a cargo de analizar los datos sobre tus listados de alquiler. Te estás preparando para los análisis haciendo una limpieza y preparación menores. Tareas Usando el conjunto de datos disponible a continuación, completa cada una de las tareas que encuentres en las preguntas. 1. Importa los datos que se encuentran en listings.csv en un Pandas DataFrame. Este conjunto de datos contiene listados de alquiler de AirBnB. Imprime el número de filas en este marco de datos usando código Python (es decir, no simplemente abras el archivo en Excel y mires el número) Después de imprimir el número de filas, imprime los primeros cinco registros ¿Cuántas filas hay en este conjunto de datos? ____________ 2. Hemos contratado a un diseñador/organizador de habitaciones profesional para ayudar a nuestros anfitriones de forma limitada. Necesitamos identificar los listados de alquiler con el mayor beneficio potencial. Itera a través de las filas de este marco de datos una a la vez usando la técnica más rápida enseñada en este capítulo. Imprima los host_ids, minimum_number of nights y price para cualquier listado con más de (o igual a) 14 noches mínimas y precio de $1000. ¿Cuántos de estos listados hay en el DataFrame? _______________ 3. Veamos exactamente cuántos ingresos se generan a partir de cada listado para una cantidad mínima de noches de estadía. Cree una nueva columna (sin usar una iteración) que sea igual al precio x minimum_nights. Llame a esta columna 'revenue'. Ordene el DataFrame por esta nueva columna de manera descendente. ¿Cuál es el ingreso potencial del listado con mayores ingresos? ______________ 4. Identifiquemos estos listados en el marco de datos con una nueva columna llamada 'design_help'. Cree una nueva columna llamada 'design_help' con el valor inicial de False para cada fila. Luego, vuelva a etiquetar estos valores como True para cualquier fila que cumpla con los criterios anteriores. Filtre e imprima el DataFrame mostrando solo aquellos registros que sean True para esta nueva columna. No ordene ni cambie el orden de estos registros en absoluto. ¿Cuál es el nombre de host del tercer registro en este DataFrame? Cópielo y péguelo a continuación exactamente como aparece: ____________ 5. El tipo de habitación (casa/apartamento entero, habitación privada, habitación de hotel, habitación compartida) puede explicar mucho sobre el precio que las personas están dispuestas a pagar. Sin embargo, no tenemos muchos registros etiquetados como 'Habitación de hotel' o 'Habitación compartida'. Vuelva a etiquetar estos valores como 'Otra habitación' para combinarlos en un solo valor. Imprima un recuento dinámico (lo que significa que se actualizará si cambiamos los datos) de la cantidad de 'Otra habitación' después de completar la actualización. ¿Qué es ese recuento? ____________ 6. Finalmente, debemos hacer algo con la columna last_review. No podremos analizarla a menos que esté en algún tipo de formato entero. Cree una nueva columna llamada 'days_since_last_review' y rellénela con la cantidad de días desde el 8 de diciembre de 2019. Esta es la fecha más reciente en este conjunto de datos. En otras palabras, el valor resultante más pequeño en esta nueva columna será cero. Imprima el valor máximo de esta nueva columna para indicar la última revisión más antigua. Aunque todavía no haya aprendido la función max(), hay otras formas de encontrar el valor máximo. Por ejemplo, puede ordenar el conjunto de datos de manera descendente y devolver el valor de la primera fila. ¿Qué es este valor? En otras palabras, ¿cuántos días hay desde la fecha de revisión más antigua hasta el 8 de diciembre de 2019? ___________ Complete el cuadro de acuerdo con las tareas y responda la pregunta a continuación Tarea 1. Importe los datos que se encuentran en listings.csv en un Pandas DataFrame. Este conjunto de datos contiene listados de alquiler de AirBnB. Imprima la cantidad de filas en este marco de datos usando código Python (es decir, no simplemente abra el archivo en Excel y mire el número) Después de imprimir la cantidad de filas, imprima los primeros cinco registros Tarea 2. Hemos contratado a un diseñador/organizador de habitaciones profesional para ayudar a nuestros anfitriones de forma limitada. Necesitamos identificar los listados de alquiler con el mayor beneficio potencial. Itere a través de las filas de este marco de datos una a la vez usando la técnica más rápida enseñada en este capítulo. Imprima los host_ids, minimum_number of nights y price para cualquier listado con más de (o igual a) 14 noches mínimas y precio de $1000 Tarea 3. Veamos exactamente cuántos ingresos se generan a partir de cada listado para una cantidad mínima de noches de estadía. Cree una nueva columna (sin usar una iteración) que sea igual al precio x minimum_nights. Llame a esta columna 'revenue'. Ordene el DataFrame por esta nueva columna de manera descendente. Tarea 4. Identifiquemos estos listados en el marco de datos con una nueva columna llamada 'design_help'. Cree una nueva columna llamada 'design_help' con el valor inicial de False para cada fila. Luego, vuelva a etiquetar estos valores como True para cualquier fila que cumpla con los criterios anteriores. Filtre e imprima el DataFrame mostrando solo aquellos registros que sean True para esta nueva columna. No ordene ni cambie el orden de estos registros en absoluto. Tarea 5. El tipo de habitación (casa/apartamento entero, habitación privada, habitación de hotel, habitación compartida) puede explicar mucho sobre el precio que las personas están dispuestas a pagar. Sin embargo, no tenemos muchos registros etiquetados como 'Habitación de hotel' o 'Habitación compartida'. Reetiquete estos valores a 'Otra habitación' para combinarlos en un solo valor. Imprima un recuento dinámico (lo que significa que se actualizará si cambiamos los datos) de la cantidad de 'Otra habitación' después de completar la actualización. Tarea 6. Finalmente, debemos hacer algo con la columna last_review. No podremos analizarla a menos que esté en algún tipo de formato entero. Cree una nueva columna llamada 'days_since_last_review' y rellénela con la cantidad de días desde el 8 de diciembre de 2019. Esta es la fecha más reciente en este conjunto de datos. En otras palabras, el valor resultante más pequeño en esta nueva columna será cero. Imprima el valor máximo de esta nueva columna para indicar la last_review más antigua. Aunque todavía no hayas aprendido la función max(), hay otras formas de encontrar el valor máximo. Por ejemplo, puedes ordenar el conjunto de datos en orden descendente y devolver el valor de la primera fila. Ayúdame con la codificación en Python.
  • Chegg Logo
    Queda solo un paso para resolver este problema.
    Solución
    Paso 1

    Necesitará tener instalada la biblioteca Pandas para trabajar con DataFrames. Si no la tiene instala...

    Mira la respuesta completa
    answer image blur
    Respuesta
    Desbloquea