SciPy stats.sem 関数
Lakshay Kapoor
2023年1月30日
統計の SEM
は平均の標準誤差
を表します。SEM
は、指定されたデータの標準偏差を計算し、それを指定されたデータのサイズの平方根で割ることによって計算されます。この標準誤差は、サンプルデータの算術平均の精度を求めるのに役立ちます。これは、与えられたデータの各サンプル間の変動性を求めることによって行われます。
したがって、指定されたサンプルデータのサイズが大きくなると、SEM
の値は小さくなります。
scipy.stats.sem
関数
SciPy
ライブラリの scipy.stats.sem
関数は、指定された入力データの SEM
、つまり標準平均誤差
を計算するのに役立ちます。
構文
scipy.stats.sem(a, axis=0, ddof=0, nan_policy="propagate")
パラメータ
a(配列) |
このパラメーターは、SEM 値が計算される入力データを定義します。 |
|
axis(int) |
このパラメータは、入力データの SEM 値が計算される軸を定義します。このパラメータのデフォルト値は 0 です。値が None の場合、関数は入力データ全体を計算するだけです。 |
|
ddof (int) |
ddof は Delta degrees-of-freedom の略です。このパラメーターは、母集団の分散に対して限られた入力サンプルでバイアスを調整するのに役立つ自由度の数を定義します。このパラメータのデフォルト値は 1 です。 |
|
nan_policy |
このパラメーターは、入力データに NaN 値がある場合の処理方法を決定します。パラメータには、propagate 、raise 、omit の 3つの決定パラメータがあります。propagate は単に NaN 値を返し、raise はエラーを返し、omit は単に NaN 値を無視し、関数は計算を続行します。これらの決定パラメータは一重引用符'' で定義されます。このパラメータのデフォルト値は propagate です。 |
a(配列)
パラメーターを除くすべてのパラメーターはオプションです。これは、この関数を使用するたびにすべてのパラメーターを定義する必要がないことを意味します。
平均の標準誤差の例
import numpy as np
from scipy import stats
array_1 = [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array_2 = [23, 35, 14, 11, 2]
print("array 1 : ", array_1)
print("array 2 : ", array_2)
print("SEM for array 1 : ", stats.sem(array_1, axis=1, ddof=1))
print("SEM for array 2 : ", stats.sem(array_2, axis=0, ddof=0))
出力:
array 1 : [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array 2 : [23, 35, 14, 11, 2]
SEM for array 1 : [2.22261108 8.14002457]
SEM for array 2 : 5.019960159204453
著者: Lakshay Kapoor
Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.
LinkedIn