Pandas DataFrame DataFrame.median() Funktion
-
Syntax von
pandas.DataFrame.median()
: -
Beispielcodes:
DataFrame.median()
Methode zur Ermittlung des Medians entlang der Spaltenachse -
Beispielcodes:
DataFrame.median()
Methode zur Ermittlung des Medians entlang der Zeilenachse -
Beispiel-Codes:
DataFrame.median()
Methode, um den Median zu finden, der dieNaN
-Werte ignoriert
Die Funktion Python Pandas DataFrame.median()
berechnet den Median der Elemente des DataFrame-Objekts entlang der angegebenen Achse.
Der Median ist nicht mean
, sondern die Mitte der Werte in der Zahlenliste.
Syntax von pandas.DataFrame.median()
:
DataFrame.median(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Parameter
axis |
den Median entlang der row (axis=0) oder column (axis=1) finden |
skipna |
Boolesch. Ausschließen von NaN -Werten (skipna=True ) oder Einschließen von NaN -Werten (skipna=False ) |
level |
Zählen Sie mit einem bestimmten Pegel mit, wenn die Achse MultiIndex ist. |
numeric_only |
Boolesch. Fügen Sie für numeric_only=True nur die Spalten float , int und boolean ein. |
**kwargs |
Zusätzliche Schlüsselwort-Argumente zu der Funktion. |
Zurück
Wenn der Level
nicht angegeben ist, geben Sie Series
des Medians der Werte für die angeforderte Achse zurück, andernfalls DataFrame
der Medianwerte.
Beispielcodes: DataFrame.median()
Methode zur Ermittlung des Medians entlang der Spaltenachse
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)
medians=df.median()
print("medians of Each Column:")
print(medians)
Ausgabe:
DataFrame:
X Y
0 1 4
1 2 3
2 7 8
3 5 2
4 10 9
medians of Each Column:
X 5.0
Y 4.0
dtype: float64
Es berechnet den Median für die beiden Spalten X
und Y
und gibt schließlich ein Series
-Objekt mit dem Median jeder Spalte zurück.
Um den Median einer bestimmten Spalte von DataFrame
in Pandas zu finden, rufen wir die median()
Funktion nur für diese Spalte auf.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)
medians=df["X"].median()
print("medians of Each Column:")
print(medians)
Ausgabe:
DataFrame:
X Y
0 1 4
1 2 3
2 7 8
3 5 2
4 10 9
medians of Each Column:
5.0
Sie gibt nur den Median der Werte der Spalte X
von DataFrame
aus.
Beispielcodes: DataFrame.median()
Methode zur Ermittlung des Medians entlang der Zeilenachse
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9],
'Z': [2, 7, 6, 10, 5]})
print("DataFrame:")
print(df)
medians=df.median(axis=1)
print("medians of Each Row:")
print(medians)
Ausgabe:
DataFrame:
X Y Z
0 1 4 2
1 2 3 7
2 7 8 6
3 5 2 10
4 10 9 5
medians of Each Row:
0 2.0
1 3.0
2 7.0
3 5.0
4 9.0
dtype: float64
Es berechnet den Median für alle Zeilen und gibt schließlich ein Series
-Objekt mit dem Median jeder Zeile zurück.
Um den Median einer bestimmten Zeile von DataFrame
in Pandas zu finden, rufen wir die median()
Funktion nur für diese Zeile auf.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
'Y': [4, 3, 8, 2, 9],
'Z': [2, 7, 6, 10, 5]})
print("DataFrame:")
print(df)
median=df.iloc[[0]].median(axis=1)
print("median of 1st Row:")
print(median)
Ausgabe:
DataFrame:
X Y Z
0 1 4 2
1 2 3 7
2 7 8 6
3 5 2 10
4 10 9 5
median of 1st Row:
0 2.0
dtype: float64
Sie gibt nur den Median der Werte der ersten Zeile des DataFrame
aus.
Wir benutzen die iloc
Methode, um Zeilen basierend auf dem Index auszuwählen.
Beispiel-Codes: DataFrame.median()
Methode, um den Median zu finden, der die NaN
-Werte ignoriert
Wir verwenden den Standardwert des Parameters skipna
, d.h. skipna=True
, um den Median des DataFrame
entlang der angegebenen Achse zu finden, indem wir die NaN
-Werte ignorieren.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, None, 10, 8],
'Y': [None, 3, 8, 2, 9, 6],
'Z': [2, 7, 6, 10, None, 5]})
print("DataFrame:")
print(df)
median=df.median(skipna=True)
print("medians of Each Row:")
print(median)
Ausgabe:
DataFrame:
X Y Z
0 1.0 NaN 2.0
1 2.0 3.0 7.0
2 7.0 8.0 6.0
3 NaN 2.0 10.0
4 10.0 9.0 NaN
5 8.0 6.0 5.0
medians of Each Row:
X 7.0
Y 6.0
Z 6.0
dtype: float64
Wenn wir skipna=True
setzen, ignoriert es die NaN
im DataFrame. Es erlaubt uns, den Median des DataFrame
entlang der Spaltenachse zu berechnen, indem wir NaN
-Werte ignorieren.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 7, None, 10],
'Y': [5, 3, 8, 2, 9],
'Z': [2, 7, 6, 10, 4]})
print("DataFrame:")
print(df)
median=df.median(skipna=False)
print("medians of Each Row:")
print(median)
Ausgabe:
DataFrame:
X Y Z
0 1.0 5 2
1 2.0 3 7
2 7.0 8 6
3 NaN 2 10
4 10.0 9 4
medians of Each Row:
X NaN
Y 5.0
Z 6.0
dtype: float64
Hier erhalten wir den NaN
-Wert für den Median der Spalte X
, da in Spalte X
der NaN
-Wert vorhanden ist.
Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.
LinkedIn Facebook