Pandas DataFrame DataFrame.plot.hist() Fonction

Minahil Noor 30 janvier 2023
  1. Syntaxe de pandas.DataFrame.plot.hist()
  2. Exemples de codes : DataFrame.plot.hist()
  3. Exemples de codes : DataFrame.plot.hist() pour dessiner un histogramme complexe
  4. Exemples de codes : DataFrame.plot.hist() pour modifier le nombre de casiers
Pandas DataFrame DataFrame.plot.hist() Fonction

La fonction Python Pandas DataFrame.plot.hist() dessine un histogramme unique des colonnes d’une DataFrame. Un histogramme représente les données sous forme graphique. Il crée des barres d’intervalles. La barre la plus haute montre que plus de données tombent dans la plage de cette barre.

Syntaxe de pandas.DataFrame.plot.hist()

DataFrame.sample(by=None, bins=10, **kwargs)

Paramètres

by Il s’agit d’une chaîne ou d’une séquence. Elle représente les colonnes de la DataFrame à regrouper.
bins C’est un nombre entier. Il représente le nombre de bacs d’histogrammes. Une case est comme une plage, par exemple, 0-5, 6-10, etc.
**kwargs Ce sont les arguments supplémentaires des mots clés pour personnaliser l’histogramme. Vous pouvez les consulter ici.

Renvoie

Il retourne un histogramme tracé et des données AxesSubplot.

Exemples de codes : DataFrame.plot.hist()

Commençons par tracer un histogramme à l’aide d’une simple DataFrame.

import pandas as pd
dataframe = pd.DataFrame({'Value':[100, 200, 300]})
print(dataframe)

Notre DataFrame ressemble à

 Value
0  100
1  200
2  300

Tous les paramètres de cette fonction sont facultatifs. Si nous exécutons cette fonction sans passer aucun paramètre, elle produit la sortie suivante.

import pandas as pd
from matplotlib import pyplot as plt

dataframe = pd.DataFrame({"Value": [100, 200, 300]})

histogram = dataframe.plot.hist()
print(histogram)
plt.show()

Production:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist Basic

Exemples de codes : DataFrame.plot.hist() pour dessiner un histogramme complexe

Maintenant, nous allons convertir notre DataFrame en un cadre complexe.

import pandas as pd
import numpy as np

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

print(dataframe)

Notre DataFrame devient,

 A    B    C
0     15  163  163
1     29    7   54
2    195   40    6
3    183   92   57
4     72  167   40
..   ...  ...  ...
195   79   35    7
196  122   79  142
197  121   46  124
198  138  141  114
199  148   95  129

[200 rows x 3 columns]

Nous avons utilisé la fonction NumPy.random.randint() pour créer une DataFrame qui contient des entiers aléatoires. Maintenant, nous allons dessiner l’histogramme de cette DataFrame en utilisant la fonction DataFrame.plot.hist().

import pandas as pd
import numpy as np

from matplotlib import pyplot as plt

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

histogram = dataframe.plot.hist()
print(histogram)
plt.show()

Production:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist Basic 2

La fonction a dessiné un histogramme qui comporte 10 cases par défaut. Il montre la distribution de fréquence de trois colonnes de la DataFrame. Chaque colonne est représentée par une couleur spécifique.

Exemples de codes : DataFrame.plot.hist() pour modifier le nombre de casiers

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

histogram = dataframe.plot.hist(bins=2)
print(histogram)
plt.show()

Production:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist avec les cases de paramètres

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))

histogram = dataframe.plot.hist(bins=50)
print(histogram)
plt.show()

Production:

AxesSubplot(0.125,0.125;0.775x0.755)

Pandas DataFrame.plot.hist avec 50 cases de paramètres

Dans le premier exemple de code, nous avons changé le nombre de bacs à 2 et dans le second exemple de code, il est de 50. Notez que plus le nombre de bacs est élevé, plus il est facile de comprendre l’histogramme. Le premier histogramme est ambigu, car nous ne pouvons pas voir les barres de la colonne A.

Article connexe - Pandas DataFrame

Article connexe - Pandas DataFrame Plot