Matplotlib Boxplot Python

Suraj Joshi 10 janvier 2021
Matplotlib Boxplot Python

Ce tutoriel explique comment créer un boxplot en utilisant la fonction matplotlib.pyplot.boxplot() en Python.

Le boxplot nous aide à mieux comprendre les données en donnant des informations sur la position des valeurs minimum, 1er quartile, médiane, 3ème quartile et maximum des données.

bxplot en Python Matplotlib

import matplotlib.pyplot as plt

x = [4, 5, 6, 8, 9, 10, 10, 11, 11, 12, 13, 14, 15, 15, 15, 17, 18, 19, 22, 23, 25]

plt.boxplot(x)
plt.title("Boxplot Using Matplotlib")
plt.show()

Production :

Boxplot en Python utilisant Matplotlib

Il trace un boxplot à partir des données données x. Dans le boxplot, la boîte s’étend de Q1 à Q3 ; et la ligne horizontale à l’intérieur de la boîte représente la médiane des données. Les moustaches dans le boxplot s’étendent de Q3 à la valeur maximale des données et de la valeur minimale des données à Q1 des données.

La valeur minimale des données est déterminée par la valeur de Q1-1.5(Q3-Q1) tandis que la valeur maximale des données est déterminée par la formule Q3+1.5(Q3-Q1).

import matplotlib.pyplot as plt

x = [
    1,
    4,
    5,
    6,
    8,
    9,
    10,
    10,
    11,
    11,
    12,
    12,
    13,
    14,
    15,
    15,
    15,
    17,
    18,
    18,
    19,
    22,
    23,
    25,
    30,
    33,
    35,
]

plt.boxplot(x)
plt.title("Boxplot Using Matplotlib")
plt.show()

Production :

Boxplot en Python utilisant Matplotlib avec des aberrations

Il trace le boxplot des données données x. Nous pouvons également remarquer deux valeurs aberrantes en haut du boxplot, représentées par des cercles dans le graphique.

Un point de données est tracé comme une valeur aberrante si sa valeur est inférieure à Q1-1,5(Q3-Q1) ou supérieure à Q3+ 1,5(Q3-Q1).

Si nous passons un tableau 2D en argument à la fonction matplotlib.pyplot.boxplot(), la fonction boxplot() fait boxplot pour chaque tableau ou la liste dans le tableau 2D.

import numpy as np
import matplotlib.pyplot as plt

np.random.seed(100)

data_a = np.random.randint(2, 15, size=15)
data_b = np.random.randint(5, 18, size=20)
data_c = np.random.randint(2, 20, size=30)
data_d = np.random.randint(1, 30, size=40)

data_2d = [data_a, data_b, data_c, data_d]

plt.boxplot(data_2d)
plt.title("Boxplot Using Matplotlib")
plt.show()

Production :

Boxplots multiples en Python en utilisant Matplotlib

Il crée un boxplot pour chaque tableau NumPy dans la liste data_2d. Ainsi, nous obtenons 4 boxplots dans un seul chiffre partageant des axes communs.

Auteur: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn