Pandas DataFrame DataFrame.mean() Fonction
-
Syntaxe de
pandas.DataFrame.mean()
: -
Exemples de codes: méthode
DataFrame.mean()
pour trouver la moyenne le long de l’axe des colonnes -
Exemples de codes: méthode
DataFrame.mean()
pour trouver la moyenne le long de l’axe Row -
Exemples de codes: méthode
DataFrame.mean()
pour trouver une moyenne ignorant les valeursNaN
Python Pandas DataFrame.mean()
, la fonction calcule la moyenne des valeurs de l’objet DataFrame sur la axe spécifié.
Syntaxe de pandas.DataFrame.mean()
:
DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Paramètres
axis |
trouver la moyenne le long de la ligne (axis = 0 ) ou de la colonne (axis = 1 ) |
skipna |
Booléen. Exclure les valeurs NaN (skipna = True ) ou inclure les valeurs NaN (skipna = False ) |
level |
Comptez avec un niveau particulier si l’axe est MultiIndex |
numeric_only |
Booléen. Pour numeric_only = True , incluez uniquement les colonnes float , int et boolean |
**kwargs |
Arguments de mots clés supplémentaires à la fonction. |
Revenir
Si le level
n’est pas spécifié, retournez Series
de la moyenne des valeurs pour l’axe demandé, sinon retournez DataFrame
des valeurs moyennes.
Exemples de codes: méthode DataFrame.mean()
pour trouver la moyenne le long de l’axe des colonnes
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean()
print("Means of Each Column:")
print(means)
Production:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Means of Each Column:
X 2.00
Y 4.75
dtype: float64
Il calcule la moyenne pour les deux colonnes X
et Y
et retourne finalement un objet Series
avec la moyenne de chaque colonne.
Pour trouver la moyenne d’une colonne particulière de DataFrame
dans Pandas, nous appelons la fonction mean()
pour cette colonne uniquement.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df["X"].mean()
print("Mean of Column X:")
print(means)
Production:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Column X:
2.0
Il ne donne que la moyenne des valeurs de la colonne X
de DataFrame
.
Exemples de codes: méthode DataFrame.mean()
pour trouver la moyenne le long de l’axe Row
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean(axis=1)
print("Mean of Rows:")
print(means)
Production:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Rows:
0 2.5
1 2.5
2 5.0
3 3.5
dtype: float64
Il calcule la moyenne de toutes les lignes et retourne finalement un objet Series
avec la moyenne de chaque ligne.
Pour trouver la moyenne d’une ligne particulière de DataFrame
dans Pandas, nous appelons la fonction mean()
pour cette ligne uniquement.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)
Production:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of 1st Row:
0 2.5
dtype: float64
Il ne donne que la moyenne des valeurs de la 1ère ligne de DataFrame
.
Nous utilisons la méthode iloc
pour sélectionner les lignes en fonction de l’index.
Exemples de codes: méthode DataFrame.mean()
pour trouver une moyenne ignorant les valeurs NaN
Nous utilisons la valeur par défaut du paramètre skipna
c’est-à-dire skipna = True
pour trouver la moyenne de DataFrame
le long de l’axe spécifié en ignorant les valeurs de NaN
.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=True)
print("Mean of Columns")
print(means)
Production:
DataFrame:
X Y
0 1.0 4.0
1 2.0 3.0
2 NaN NaN
3 3.0 4.0
Mean of Columns
X 2.000000
Y 3.666667
dtype: float64
Si nous définissons skipna = True
, il ignore le NaN
dans la trame de données. Il nous permet de calculer la moyenne de DataFrame
le long de l’axe de la colonne en ignorant les valeurs de NaN
.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)
Production:
DataFrame:
X Y
0 1.0 4
1 2.0 3
2 NaN 3
3 3.0 4
Mean of Columns
X NaN
Y 3.5
dtype: float64
Ici, nous obtenons une valeur de NaN
pour la moyenne de la colonne X
car la colonne X
contient une valeur de NaN
.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn