Pandas DataFrame DataFrame.mean() Funktion

Suraj Joshi 30 Januar 2023
  1. Syntax von pandas.DataFrame.mean():
  2. Beispielcodes: DataFrame.mean() Methode zur Ermittlung des Mittelwertes entlang der Spaltenachse
  3. Beispielcodes: DataFrame.mean() Methode zur Ermittlung des Mittelwertes entlang der Zeilenachse
  4. Beispielcodes: DataFrame.mean() Methode zur Ermittlung des Mittelwertes unter Ignorierung der NaN-Werte
Pandas DataFrame DataFrame.mean() Funktion

Die Funktion Python Pandas DataFrame.mean() berechnet den Mittelwert der Werte des DataFrame-Objekts über die angegebene Achse.

Syntax von pandas.DataFrame.mean():

DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

Parameter

axis Mittelwert entlang der row (axis=0) oder column (axis=1) finden
skipna Boolesch. Ausschließen von NaN-Werten (skipna=True) oder Einschließen von NaN-Werten (skipna=False)
level Zählen Sie mit einem bestimmten Pegel mit, wenn die Achse MultiIndex ist.
numeric_only Boolesch. Fügen Sie für numeric_only=True nur die Spalten float, int und boolean ein.
**kwargs Zusätzliche Schlüsselwort-Argumente zu der Funktion.

Zurück

Wenn der Level nicht angegeben ist, geben Sie Series des Mittelwertes der Werte für die angeforderte Achse zurück, andernfalls DataFrame der Mittelwerte.

Beispielcodes: DataFrame.mean() Methode zur Ermittlung des Mittelwertes entlang der Spaltenachse

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean()
print("Means of Each Column:")
print(means)

Ausgabe:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Means of Each Column:
X    2.00
Y    4.75
dtype: float64

Es berechnet den Mittelwert für die beiden Spalten X und Y und gibt schließlich ein Series-Objekt mit dem Mittelwert jeder Spalte zurück.

Um den Mittelwert einer bestimmten Spalte von DataFrame in Pandas zu ermitteln, rufen wir die mean() Funktion nur für diese Spalte auf.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df["X"].mean()
print("Mean of Column X:")
print(means)

Ausgabe:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Column X:
2.0

Sie gibt nur den Mittelwert der Werte der Spalte X von DataFrame aus.

Beispielcodes: DataFrame.mean() Methode zur Ermittlung des Mittelwertes entlang der Zeilenachse

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean(axis=1)
print("Mean of Rows:")
print(means)

Ausgabe:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Rows:
0    2.5
1    2.5
2    5.0
3    3.5
dtype: float64

Es berechnet den Mittelwert für alle Zeilen und gibt schließlich ein Series-Objekt mit dem Mittelwert jeder Zeile zurück.

Um den Mittelwert einer bestimmten Zeile von DataFrame in Pandas zu finden, rufen wir die mean() Funktion nur für diese Zeile auf.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)

Ausgabe:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of 1st Row:
0    2.5
dtype: float64

Sie gibt nur den Mittelwert der Werte der ersten Zeile des DataFrame aus.

Wir benutzen die iloc Methode, um Zeilen basierend auf dem Index auszuwählen.

Beispielcodes: DataFrame.mean() Methode zur Ermittlung des Mittelwertes unter Ignorierung der NaN-Werte

Wir verwenden den Standardwert des skipna-Parameters, d.h. skipna=True, um den Mittelwert von DataFrame entlang der angegebenen Achse zu finden, wobei NaN-Werte ignoriert werden.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)

means=df.mean(skipna=True)
print("Mean of Columns")
print(means)

Ausgabe:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  3.0
2  NaN  NaN
3  3.0  4.0
Mean of Columns
X    2.000000
Y    3.666667
dtype: float64

Wenn wir skipna=True setzen, ignoriert es die NaN im DataFrame. Damit können wir den Mittelwert des DataFrame entlang der Spaltenachse berechnen, wobei NaN-Werte ignoriert werden.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)

Ausgabe:

DataFrame:
     X  Y
0  1.0  4
1  2.0  3
2  NaN  3
3  3.0  4
Mean of Columns
X    NaN
Y    3.5
dtype: float64

Hier erhalten wir den NaN-Wert für den Mittelwert der Spalte X, da die Spalte X den NaN-Wert enthält.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Verwandter Artikel - Pandas DataFrame