BoxPlot Seaborn

Manav Narula 16 juillet 2021
BoxPlot Seaborn

Différents graphiques et graphiques statistiques peuvent être créés à l’aide du module Seaborn en Python. Nous pouvons créer une boîte à moustaches en utilisant la fonction seaborn.boxplot().

Les analystes et les statisticiens utilisent fréquemment une boîte à moustaches pour représenter les données à différents niveaux ou catégories. La figure de la boîte à moustaches peut véhiculer de nombreuses valeurs statistiques. La figure suivante explique cela.

Informations sur la boîte à moustaches

La fonction boxplot() fonctionne efficacement pour tracer les valeurs catégorielles d’un ensemble de données et peut également fonctionner avec des listes simples ou des vecteurs de tableau. C’est très similaire à l’intrigue du violon.

Dans l’exemple suivant, nous traçons une boîte à moustaches pour une seule distribution pour avoir une idée du chiffre final.

import random
import numpy as np
import seaborn as sns

n = random.sample(range(0, 50), 30)
arr = np.array(n)
sns.boxplot(n)

boîte à moustaches pour une seule variable

Nous pouvons également tracer un nuage de points sur la boîte à moustaches. Cela vous donnera une meilleure compréhension de la distribution tracée et du chiffre final.

Nous utiliserons la fonction seaborn.stripplot() pour tracer le nuage de points. Par example,

import random
import numpy as np
import seaborn as sns

n = random.sample(range(0, 50), 30)
arr = np.array(n)
sns.boxplot(n)
sns.stripplot(n, color="red")

stripplot sur boîte à moustaches

La boîte à moustaches peut être utilisée efficacement pour tracer les variables catégorielles et simplifier leur comparaison. Dans le code suivant, nous tracerons la boîte à moustaches pour plusieurs catégories.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)

sns.boxplot(data=df, y="Price", x="Quantity")

boîte à moustaches pour les données catégorielles

Remarquez comment, dans l’ensemble de données ci-dessus, nous pouvons facilement comparer le prix entre différentes quantités. Nous pouvons également ajouter le paramètre hue et définir sa valeur en tant que variable Product. De cette façon, nous pourrons tracer différentes boîtes pour différents produits.

Nous pouvons utiliser matplotlib.pyplot.ylim() et matplotlib.pyplot.xlim() pour définir les limites sur les axes x et y du tracé.

Nous pouvons utiliser beaucoup plus de paramètres pour peaufiner le tracé final. Le paramètre linewidth permet d’augmenter l’épaisseur des bordures du box plot. Nous pouvons personnaliser les couleurs pour différentes catégories en utilisant le paramètre palette. L’orientation peut être modifiée à l’aide de l’argument orient. Il existe de nombreux autres arguments de ce type qui peuvent être utilisés.

Voir le code ci-dessous pour comprendre l’application de certains de ces paramètres.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)

sns.boxplot(
    data=df, y="Price", x="Quantity", hue="Product", linewidth=2.5, palette="Set2"
)

boîte à moustaches pour plusieurs colonnes avec des arguments

Nous pouvons également utiliser la fonction catplot() pour créer une boîte à moustaches. La fonction catplot() fonctionne très bien pour tracer des valeurs catégorielles. Pour créer une boîte à moustaches à l’aide de cette fonction, nous devons spécifier la valeur du paramètre kind dans la fonction catplot() comme box.

Auteur: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn