Agrupación de los datos de los peces
Ahora utilizarás tu proceso de normalización y agrupación del ejercicio anterior para agrupar los peces según sus medidas, y luego crearás una tabulación cruzada para comparar las etiquetas de los grupos con las especies de peces.
Como antes, samples es la matriz 2D de medidas de los peces. Tu canalización está disponible como pipeline, y la especie de cada muestra de peces viene dada por la lista species.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones del ejercicio
- Importa
pandascomopd. - Ajusta la canalización a las medidas del pez
samples. - Obtén las etiquetas de los grupos de
samplesutilizando el método.predict()depipeline. - Utilizando
pd.DataFrame(), crea un DataFramedfcon dos columnas llamadas'labels'y'species', utilizandolabelsyspecies, respectivamente, para los valores de las columnas. - Utilizando
pd.crosstab(), crea una tabulación cruzadactdedf['labels']ydf['species'].
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)