Pandas DataFrame DataFrame.plot.hist()-Funktion
-
Syntax von
pandas.DataFrame.plot.hist()
-
Beispiel-Codes:
DataFrame.plot.hist()
-
Beispielcodes:
DataFrame.plot.hist()
zum Zeichnen eines komplexen Histogramms -
Beispielcodes:
DataFrame.plot.hist()
zur Änderung der Anzahl der Bins
Die Funktion Python Pandas DataFrame.plot.hist()
zeichnet ein einzelnes Histogramm der Spalten eines DataFrames
. Ein Histogramm stellt die Daten in der grafischen Form dar. Es erzeugt Balken von Bereichen. Der höhere Balken zeigt, dass mehr Daten in den Bereich dieses Balkens fallen.
Syntax von pandas.DataFrame.plot.hist()
DataFrame.sample(by=None, bins=10, **kwargs)
Parameter
by |
Es ist eine Zeichenkette oder eine Sequenz. Sie repräsentiert die Spalten des DataFrame , nach denen gruppiert werden soll. |
bins |
Es ist eine ganze Zahl. Sie stellt die Anzahl der Histogramm-Bins dar. Ein Behälter ist wie ein Bereich, zum Beispiel 0-5, 6-10, usw. |
**kwargs |
Dies sind die zusätzlichen Stichwortargumente zur Anpassung des Histogramms. Sie können diese [hier] überprüfen (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.html#pandas.DataFrame.plot). |
Zurück
Es gibt ein geplottetes Histogramm und AxesSubplot
-Daten zurück.
Beispiel-Codes: DataFrame.plot.hist()
Lassen Sie uns zunächst ein Histogramm unter Verwendung eines einfachen DataFrame
zeichnen.
import pandas as pd
dataframe = pd.DataFrame({'Value':[100, 200, 300]})
print(dataframe)
Unser DataFrame
sieht folgendermaßen aus
Value
0 100
1 200
2 300
Alle Parameter dieser Funktion sind optional. Wenn wir diese Funktion ausführen, ohne einen Parameter zu übergeben, erzeugt sie die folgende Ausgabe.
import pandas as pd
from matplotlib import pyplot as plt
dataframe = pd.DataFrame({"Value": [100, 200, 300]})
histogram = dataframe.plot.hist()
print(histogram)
plt.show()
Ausgabe:
AxesSubplot(0.125,0.125;0.775x0.755)
Beispielcodes: DataFrame.plot.hist()
zum Zeichnen eines komplexen Histogramms
Jetzt werden wir unseren DataFrame
in einen komplexen konvertieren.
import pandas as pd
import numpy as np
dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))
print(dataframe)
Unser DataFrame
wird,
A B C
0 15 163 163
1 29 7 54
2 195 40 6
3 183 92 57
4 72 167 40
.. ... ... ...
195 79 35 7
196 122 79 142
197 121 46 124
198 138 141 114
199 148 95 129
[200 rows x 3 columns]
Wir haben die Funktion NumPy.random.randint()
verwendet, um einen DataFrame
zu erzeugen, der zufällige ganze Zahlen enthält. Nun werden wir das Histogramm dieses DataFrame
mit der Funktion DataFrame.plot.hist()
zeichnen.
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))
histogram = dataframe.plot.hist()
print(histogram)
plt.show()
Ausgabe:
AxesSubplot(0.125,0.125;0.775x0.755)
Die Funktion hat ein Histogramm gezeichnet, das standardmäßig 10 Bins hat. Es zeigt die Häufigkeitsverteilung von drei Spalten des DataFrame
. Jede Spalte wird durch eine bestimmte Farbe dargestellt.
Beispielcodes: DataFrame.plot.hist()
zur Änderung der Anzahl der Bins
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))
histogram = dataframe.plot.hist(bins=2)
print(histogram)
plt.show()
Ausgabe:
AxesSubplot(0.125,0.125;0.775x0.755)
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
dataframe = pd.DataFrame(np.random.randint(0, 200, size=(200, 3)), columns=list("ABC"))
histogram = dataframe.plot.hist(bins=50)
print(histogram)
plt.show()
Ausgabe:
AxesSubplot(0.125,0.125;0.775x0.755)
Im ersten Beispielcode haben wir die Anzahl der Behälter auf 2 geändert, im zweiten Beispielcode sind es 50. Beachten Sie, dass das Histogramm umso leichter zu verstehen ist, je größer die Anzahl der Bins ist. Das erste Histogramm ist mehrdeutig, da wir nicht in der Lage sind, die Spalte A
Balken zu sehen.
Verwandter Artikel - Pandas DataFrame
- Pandas concat Funktion
- Pandas cut Funktion
- Pandas DataFrame sort_index() Funktion
- Pandas DataFrame.idxmax() Funktion
- Pandas DataFrame.insert() Funktion
- Pandas DataFrame.resample() Funktion