Parágrafo Seaborn en Python
En Python, usamos el módulo seaborn para crear diferentes tipos de gráficos y diagramas para visualizar un conjunto de datos. Las diferentes funciones crean diferentes tipos de gráficos. A veces, un solo gráfico puede no ser suficiente para visualizar un conjunto de datos y es posible que necesitemos trazar varios gráficos simultáneamente. La función pairplot()
puede ayudar con esto.
Este tutorial presentará cómo usar la función pairplot()
del módulo seaborn en Python.
Se basa en la clase PairGrid
de seaborn y devuelve un objeto de su tipo. También traza todas las columnas numéricas de los datos en ambos ejes, mostrando un array de diferentes gráficos. Produce una figura final con un gráfico uniforme en la diagonal y un gráfico diferente en los triángulos superior e inferior.
Si queremos, podemos especificar las variables requeridas para ser graficadas usando el argumento x_vars
, y_vars
, o el argumento vars
dentro de la función pairplot()
.
Por ejemplo,
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df)
En el código anterior, creamos un ejemplo simple de la función pairplot()
. Observe las diferentes gráficas trazadas en diagonal.
Podemos modificar el resultado final utilizando algunos métodos y parámetros. El parámetro hue
se puede utilizar para trazar las diferentes categorías en diferentes colores. El argumento palette
puede definir los colores utilizados para esto. Se agrega una leyenda común para todos los gráficos. Podemos agregar esto en el ejemplo anterior para distinguir los dos productos.
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df, hue="Product", palette="husl")
También podemos controlar el tipo de gráficos que se trazarán en la parte superior-inferior o en los triángulos y la diagonal. El parámetro diag_kind
se utiliza para especificar los gráficos de la diagonal y el parámetro kind
para el resto. Su valor puede ser reg
, scatter
, kde
, hist
o algún otro gráfico.
Por ejemplo,
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df, hue="Product", diag_kind="hist", kind="scatter")
Para personalizar las parcelas individuales en diagonal y de otro modo, usamos los parámetros plot_kws
y diag_kws
. Pasamos las personalizaciones necesarias como pares clave-valor de diccionario. Podemos alterar la altura de las parcelas individuales también usando el parámetro height
.
Además, recuerde que devuelve un objeto de la clase PairGrid
para personalizar la figura final usando métodos de esa clase.
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn