Pairplot Seaborn en Python
En Python, nous utilisons le module seaborn pour créer différents types de graphiques et de tracés afin de visualiser un ensemble de données. Différentes fonctions créent différents types de tracés. Parfois, un seul graphique peut ne pas suffire pour visualiser un ensemble de données, et nous pouvons avoir besoin de tracer plusieurs graphiques simultanément. La fonction pairplot()
peut vous aider.
Ce tutoriel présentera comment utiliser la fonction pairplot()
du module seaborn en Python.
Il est basé sur la classe PairGrid
de seaborn et renvoie un objet de son type. Il trace également toutes les colonnes numériques des données sur les deux axes, affichant une matrice de différents tracés. Il produit une figure finale avec un graphique uniforme sur la diagonale et un tracé différent sur les triangles supérieur et inférieur.
Si nous le souhaitons, nous pouvons spécifier les variables requises à tracer à l’aide de l’argument x_vars
, y_vars
ou vars
dans la fonction pairplot()
.
Par example,
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df)
Dans le code ci-dessus, nous créons un exemple simple de la fonction pairplot()
. Remarquez les différents graphiques tracés sur la diagonale.
Nous pouvons modifier le résultat final en utilisant quelques méthodes et paramètres. Le paramètre hue
peut être utilisé pour tracer les différentes catégories dans différentes couleurs. L’argument palette
permet de définir les couleurs utilisées pour cela. Une légende commune est ajoutée pour tous les graphiques. Nous pouvons ajouter ceci dans l’exemple ci-dessus pour distinguer les deux produits.
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df, hue="Product", palette="husl")
Nous pouvons également contrôler le type de graphiques à tracer sur le haut-bas ou les triangles et la diagonale. Le paramètre diag_kind
permet de spécifier les tracés pour la diagonale et le paramètre kind
pour le reste. Leur valeur peut être reg
, scatter
, kde
, hist
ou un autre tracé.
Par example,
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df, hue="Product", diag_kind="hist", kind="scatter")
Pour personnaliser les tracés individuels sur la diagonale et autrement, nous utilisons les paramètres plot_kws
et diag_kws
. Nous transmettons les personnalisations requises sous forme de paires clé-valeur de dictionnaire. Nous pouvons également modifier la hauteur des parcelles individuelles en utilisant le paramètre height
.
De plus, n’oubliez pas qu’il renvoie un objet de la classe PairGrid
pour personnaliser la figure finale en utilisant les méthodes de cette classe.
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn