Pandas DataFrame DataFrame.median() Fonction

Jinku Hu 30 janvier 2023
  1. Syntaxe de pandas.DataFrame.median():
  2. Exemples de codes: méthode DataFrame.median() pour trouver la médiane le long de l’axe des colonnes
  3. Exemples de codes: méthode DataFrame.median() pour trouver la médiane le long de l’axe Row
  4. Exemples de codes: méthode DataFrame.median() pour trouver la médiane en ignorant les valeurs NaN
Pandas DataFrame DataFrame.median() Fonction

Python Pandas DataFrame.median(), la fonction calcule la médiane des éléments de l’objet DataFrame avec l’axe spécifié.

La médiane n’est pas mean, mais le milieu des valeurs dans la liste des nombres.

Pandas DataFrame médiane

Syntaxe de pandas.DataFrame.median():

DataFrame.median(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

Paramètres

axis trouver la médiane le long de la ligne (axis = 0) ou de la colonne (axis = 1)
skipna Booléen. Exclure les valeurs NaN ( skipna = True) ou inclure les valeurs NaN (skipna = False)
level Comptez avec un niveau particulier si l’axe est MultiIndex
numeric_only Booléen. Pour numeric_only = True, incluez uniquement les colonnes float, int et boolean
**kwargs Arguments de mots clés supplémentaires à la fonction.

Revenir

Si le niveau n’est pas spécifié, retournez Series de la médiane des valeurs pour l’axe demandé, sinon retournez DataFrame des valeurs médianes.

Exemples de codes: méthode DataFrame.median() pour trouver la médiane le long de l’axe des colonnes

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
                   'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)

medians=df.median()
print("medians of Each Column:")
print(medians)

Production:

DataFrame:
    X  Y
0   1  4
1   2  3
2   7  8
3   5  2
4  10  9
medians of Each Column:
X    5.0
Y    4.0
dtype: float64

Il calcule la médiane des deux colonnes X et Y et retourne finalement un objet Series avec la médiane de chaque colonne.

Pour trouver la médiane d’une colonne particulière de DataFrame dans Pandas, nous appelons la fonction median() pour cette colonne uniquement.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
                   'Y': [4, 3, 8, 2, 9]})
print("DataFrame:")
print(df)

medians=df["X"].median()
print("medians of Each Column:")
print(medians)

Production:

DataFrame:
    X  Y
0   1  4
1   2  3
2   7  8
3   5  2
4  10  9
medians of Each Column:
5.0

Il donne uniquement la médiane des valeurs de la colonne X de DataFrame.

Exemples de codes: méthode DataFrame.median() pour trouver la médiane le long de l’axe Row

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
                   'Y': [4, 3, 8, 2, 9],
                   'Z': [2, 7, 6, 10, 5]})
print("DataFrame:")
print(df)

medians=df.median(axis=1)
print("medians of Each Row:")
print(medians)

Production:

DataFrame:
    X  Y   Z
0   1  4   2
1   2  3   7
2   7  8   6
3   5  2  10
4  10  9   5
medians of Each Row:
0    2.0
1    3.0
2    7.0
3    5.0
4    9.0
dtype: float64

Il calcule la médiane de toutes les lignes et retourne finalement un objet Series avec la médiane de chaque ligne.

Pour trouver la médiane d’une ligne particulière de DataFrame dans Pandas, nous appelons la fonction median() pour cette ligne uniquement.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, 5, 10],
                   'Y': [4, 3, 8, 2, 9],
                   'Z': [2, 7, 6, 10, 5]})

print("DataFrame:")
print(df)

median=df.iloc[[0]].median(axis=1)
print("median of 1st Row:")
print(median)

Production:

DataFrame:
    X  Y   Z
0   1  4   2
1   2  3   7
2   7  8   6
3   5  2  10
4  10  9   5
median of 1st Row:
0    2.0
dtype: float64

Il donne seulement la médiane des valeurs de la 1ère ligne de DataFrame.

Nous utilisons la méthode iloc pour sélectionner des lignes en fonction de l’index.

Exemples de codes: méthode DataFrame.median() pour trouver la médiane en ignorant les valeurs NaN

Nous utilisons la valeur par défaut du paramètre skipna c’est-à-dire skipna = True pour trouver la médiane de DataFrame le long de l’axe spécifié en ignorant les valeurs de NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, None, 10, 8],
                   'Y': [None, 3, 8, 2, 9, 6],
                   'Z': [2, 7, 6, 10, None, 5]})

print("DataFrame:")
print(df)

median=df.median(skipna=True)
print("medians of Each Row:")
print(median)

Production:

DataFrame:
      X    Y     Z
0   1.0  NaN   2.0
1   2.0  3.0   7.0
2   7.0  8.0   6.0
3   NaN  2.0  10.0
4  10.0  9.0   NaN
5   8.0  6.0   5.0
medians of Each Row:
X    7.0
Y    6.0
Z    6.0
dtype: float64

Si nous définissons skipna = True, il ignore le NaN dans la trame de données. Il nous permet de calculer la médiane de DataFrame le long de l’axe de la colonne en ignorant les valeurs de NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 7, None, 10],
                   'Y': [5, 3, 8, 2, 9],
                   'Z': [2, 7, 6, 10, 4]})

print("DataFrame:")
print(df)

median=df.median(skipna=False)
print("medians of Each Row:")
print(median)

Production:

DataFrame:
      X  Y   Z
0   1.0  5   2
1   2.0  3   7
2   7.0  8   6
3   NaN  2  10
4  10.0  9   4
medians of Each Row:
X    NaN
Y    5.0
Z    6.0
dtype: float64

Ici, nous obtenons une valeur de NaN pour la médiane de la colonne X car la colonne X contient une valeur de NaN.

Auteur: Jinku Hu
Jinku Hu avatar Jinku Hu avatar

Founder of DelftStack.com. Jinku has worked in the robotics and automotive industries for over 8 years. He sharpened his coding skills when he needed to do the automatic testing, data collection from remote servers and report creation from the endurance test. He is from an electrical/electronics engineering background but has expanded his interest to embedded electronics, embedded programming and front-/back-end programming.

LinkedIn Facebook

Article connexe - Pandas DataFrame