Pandas DataFrame DataFrame.mean() Funktion
-
Syntax von
pandas.DataFrame.mean()
: -
Beispielcodes:
DataFrame.mean()
Methode zur Ermittlung des Mittelwertes entlang der Spaltenachse -
Beispielcodes:
DataFrame.mean()
Methode zur Ermittlung des Mittelwertes entlang der Zeilenachse -
Beispielcodes:
DataFrame.mean()
Methode zur Ermittlung des Mittelwertes unter Ignorierung derNaN
-Werte
Die Funktion Python Pandas DataFrame.mean()
berechnet den Mittelwert der Werte des DataFrame-Objekts über die angegebene Achse.
Syntax von pandas.DataFrame.mean()
:
DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Parameter
axis |
Mittelwert entlang der row (axis=0) oder column (axis=1) finden |
skipna |
Boolesch. Ausschließen von NaN -Werten (skipna=True ) oder Einschließen von NaN -Werten (skipna=False ) |
level |
Zählen Sie mit einem bestimmten Pegel mit, wenn die Achse MultiIndex ist. |
numeric_only |
Boolesch. Fügen Sie für numeric_only=True nur die Spalten float , int und boolean ein. |
**kwargs |
Zusätzliche Schlüsselwort-Argumente zu der Funktion. |
Zurück
Wenn der Level
nicht angegeben ist, geben Sie Series
des Mittelwertes der Werte für die angeforderte Achse zurück, andernfalls DataFrame
der Mittelwerte.
Beispielcodes: DataFrame.mean()
Methode zur Ermittlung des Mittelwertes entlang der Spaltenachse
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean()
print("Means of Each Column:")
print(means)
Ausgabe:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Means of Each Column:
X 2.00
Y 4.75
dtype: float64
Es berechnet den Mittelwert für die beiden Spalten X
und Y
und gibt schließlich ein Series
-Objekt mit dem Mittelwert jeder Spalte zurück.
Um den Mittelwert einer bestimmten Spalte von DataFrame
in Pandas zu ermitteln, rufen wir die mean()
Funktion nur für diese Spalte auf.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df["X"].mean()
print("Mean of Column X:")
print(means)
Ausgabe:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Column X:
2.0
Sie gibt nur den Mittelwert der Werte der Spalte X
von DataFrame
aus.
Beispielcodes: DataFrame.mean()
Methode zur Ermittlung des Mittelwertes entlang der Zeilenachse
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean(axis=1)
print("Mean of Rows:")
print(means)
Ausgabe:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Rows:
0 2.5
1 2.5
2 5.0
3 3.5
dtype: float64
Es berechnet den Mittelwert für alle Zeilen und gibt schließlich ein Series
-Objekt mit dem Mittelwert jeder Zeile zurück.
Um den Mittelwert einer bestimmten Zeile von DataFrame
in Pandas zu finden, rufen wir die mean()
Funktion nur für diese Zeile auf.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)
Ausgabe:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of 1st Row:
0 2.5
dtype: float64
Sie gibt nur den Mittelwert der Werte der ersten Zeile des DataFrame
aus.
Wir benutzen die iloc
Methode, um Zeilen basierend auf dem Index auszuwählen.
Beispielcodes: DataFrame.mean()
Methode zur Ermittlung des Mittelwertes unter Ignorierung der NaN
-Werte
Wir verwenden den Standardwert des skipna
-Parameters, d.h. skipna=True
, um den Mittelwert von DataFrame
entlang der angegebenen Achse zu finden, wobei NaN
-Werte ignoriert werden.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=True)
print("Mean of Columns")
print(means)
Ausgabe:
DataFrame:
X Y
0 1.0 4.0
1 2.0 3.0
2 NaN NaN
3 3.0 4.0
Mean of Columns
X 2.000000
Y 3.666667
dtype: float64
Wenn wir skipna=True
setzen, ignoriert es die NaN
im DataFrame. Damit können wir den Mittelwert des DataFrame
entlang der Spaltenachse berechnen, wobei NaN
-Werte ignoriert werden.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)
Ausgabe:
DataFrame:
X Y
0 1.0 4
1 2.0 3
2 NaN 3
3 3.0 4
Mean of Columns
X NaN
Y 3.5
dtype: float64
Hier erhalten wir den NaN
-Wert für den Mittelwert der Spalte X
, da die Spalte X
den NaN
-Wert enthält.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn