Matplotlib Boxplot Python
Ce tutoriel explique comment créer un boxplot
en utilisant la fonction matplotlib.pyplot.boxplot()
en Python.
Le boxplot nous aide à mieux comprendre les données en donnant des informations sur la position des valeurs minimum
, 1er quartile
, médiane
, 3ème quartile
et maximum
des données.
bxplot en Python Matplotlib
import matplotlib.pyplot as plt
x = [4, 5, 6, 8, 9, 10, 10, 11, 11, 12, 13, 14, 15, 15, 15, 17, 18, 19, 22, 23, 25]
plt.boxplot(x)
plt.title("Boxplot Using Matplotlib")
plt.show()
Production :
Il trace un boxplot à partir des données données x
. Dans le boxplot, la boîte s’étend de Q1
à Q3
; et la ligne horizontale à l’intérieur de la boîte représente la médiane des données. Les moustaches dans le boxplot s’étendent de Q3
à la valeur maximale
des données et de la valeur minimale
des données à Q1
des données.
La valeur minimale des données est déterminée par la valeur de Q1-1.5(Q3-Q1)
tandis que la valeur maximale des données est déterminée par la formule Q3+1.5(Q3-Q1)
.
import matplotlib.pyplot as plt
x = [
1,
4,
5,
6,
8,
9,
10,
10,
11,
11,
12,
12,
13,
14,
15,
15,
15,
17,
18,
18,
19,
22,
23,
25,
30,
33,
35,
]
plt.boxplot(x)
plt.title("Boxplot Using Matplotlib")
plt.show()
Production :
Il trace le boxplot des données données x
. Nous pouvons également remarquer deux valeurs aberrantes en haut du boxplot, représentées par des cercles dans le graphique.
Un point de données est tracé comme une valeur aberrante si sa valeur est inférieure à Q1-1,5(Q3-Q1)
ou supérieure à Q3+ 1,5(Q3-Q1)
.
Si nous passons un tableau 2D en argument à la fonction matplotlib.pyplot.boxplot()
, la fonction boxplot()
fait boxplot
pour chaque tableau ou la liste dans le tableau 2D.
import numpy as np
import matplotlib.pyplot as plt
np.random.seed(100)
data_a = np.random.randint(2, 15, size=15)
data_b = np.random.randint(5, 18, size=20)
data_c = np.random.randint(2, 20, size=30)
data_d = np.random.randint(1, 30, size=40)
data_2d = [data_a, data_b, data_c, data_d]
plt.boxplot(data_2d)
plt.title("Boxplot Using Matplotlib")
plt.show()
Production :
Il crée un boxplot
pour chaque tableau NumPy dans la liste data_2d
. Ainsi, nous obtenons 4 boxplots dans un seul chiffre partageant des axes communs.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn