Pandas DataFrame DataFrame.mean()関数

Suraj Joshi 2023年1月30日
  1. pandas.DataFrame.mean() の構文:
  2. コード例:列軸に沿って平均値を計算するための DataFrame.mean() メソッド
  3. コード例:行軸に沿って平均値を計算するための DataFrame.mean() メソッド
  4. コード例:NaN 値を無視するに 平均値を計算するための DataFrame.mean() メソッド
Pandas DataFrame DataFrame.mean()関数

Python Pandas DataFrame.mean() 関数は指定された軸上の DataFrame オブジェクトの値の平均値を計算します。

pandas.DataFrame.mean() の構文:

DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

パラメーター

axis 行(axis = 0)または列(axis = 1)に沿って平均を計算します
skipna ブール。NaN 値を除外する(skipna=True)または NaN 値を含める(skipna=False
level 軸が MultiIndex の場合、特定のレベルとともにカウントします
numeric_only ブール。numeric_only=True の場合、floatint、および boolean 列のみを含めます
**kwargs 関数への追加のキーワード引数。

戻り値

level が指定されていない場合は、要求された軸の値の平均値の Series を返し、それ以外の場合は平均値の DataFrame を返します。

コード例:列軸に沿って平均値を計算するための DataFrame.mean() メソッド

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean()
print("Means of Each Column:")
print(means)

出力:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Means of Each Column:
X    2.00
Y    4.75
dtype: float64

XY の両方の列の平均値を計算し、最後に各列の平均値を含む Series オブジェクトを返します。

Pandas で DataFrame の特定の列の平均値を計算するには、その列に対してのみ mean() 関数を呼び出します。

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df["X"].mean()
print("Mean of Column X:")
print(means)

出力:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Column X:
2.0

DataFrameX 列の値の平均のみを示します。

コード例:行軸に沿って平均値を計算するための DataFrame.mean() メソッド

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean(axis=1)
print("Mean of Rows:")
print(means)

出力:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Rows:
0    2.5
1    2.5
2    5.0
3    3.5
dtype: float64

すべての行の平均を計算し、最後に各行の平均を含む Series オブジェクトを返します。

Pandas で DataFrame の特定の行の平均値を計算するには、その行に対してのみ mean() 関数を呼び出します。

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)

出力:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of 1st Row:
0    2.5
dtype: float64

DataFrame の 1 行目の値の平均のみを示します。

インデックスに基づいて行を選択するには、iloc メソッドを使用します。

コード例:NaN 値を無視するに 平均値を計算するための DataFrame.mean() メソッド

skipna パラメータのデフォルト値、つまり skipna=True を使用して、NaN 値を無視して、指定された軸に沿った DataFrame の平均を見つけます。

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)

means=df.mean(skipna=True)
print("Mean of Columns")
print(means)

出力:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  3.0
2  NaN  NaN
3  3.0  4.0
Mean of Columns
X    2.000000
Y    3.666667
dtype: float64

skipna = True を設定すると、DataFrameNaN は無視されます。これにより、NaN 値を無視して列軸に沿った DataFrame の平均を計算できます。

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)

出力:

DataFrame:
     X  Y
0  1.0  4
1  2.0  3
2  NaN  3
3  3.0  4
Mean of Columns
X    NaN
Y    3.5
dtype: float64

ここでは、列 XNaN 値が存在するため、列 X の平均の NaN 値を取得します。

著者: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

関連記事 - Pandas DataFrame