Fonction SciPy stats.sem
SEM
dans les statistiques signifie Standard Error of the Mean
. SEM
est calculé en calculant l’écart type des données données, puis en le divisant par la racine carrée de la taille des données données. Cette erreur standard aide à déterminer l’exactitude de la moyenne arithmétique des données de l’échantillon. Cela se fait en découvrant la variabilité entre chaque échantillon dans les données données.
Ainsi, à mesure que la taille des données d’échantillon données augmente, la valeur du SEM
diminue.
La fonction scipy.stats.sem
La fonction scipy.stats.sem
de la bibliothèque SciPy
permet de calculer le SEM
c’est à dire le Standard Mean Error
des données d’entrée données.
Syntaxe
scipy.stats.sem(a, axis=0, ddof=0, nan_policy="propagate")
Paramètre
a (tableau) |
Ce paramètre définit les données d’entrée pour lesquelles la valeur SEM est calculée. |
|
axis (entier) |
Ce paramètre définit l’axe selon lequel la valeur SEM des données d’entrée est calculée. La valeur par défaut de ce paramètre est 0 . Si la valeur est None , alors la fonction calcule simplement sur l’ensemble des données d’entrée. |
|
ddof (entier) |
ddof est l’abréviation de Delta degrees-of-freedom . Ce paramètre définit le nombre de degrés de liberté qui aide à ajuster le biais avec des échantillons d’entrée limités par rapport à la variance de la population. La valeur par défaut de ce paramètre est 1 . |
|
nan_policy |
Ce paramètre décide de la façon de gérer les valeurs NaN dans les données d’entrée. Il y a trois paramètres de décision dans le paramètre, propagate , raise , omit . propagate renvoie simplement la valeur NaN, raise renvoie une erreur et omit ignore simplement les valeurs NaN et la fonction continue le calcul. Ces paramètres de décision sont définis entre guillemets simples '' . La valeur par défaut de ce paramètre est propagate . |
Tous les paramètres sauf le paramètre a (array)
sont facultatifs. Cela signifie qu’il n’est pas nécessaire de définir tous les paramètres lors de l’utilisation de cette fonction.
Exemple d’erreur standard de la moyenne
import numpy as np
from scipy import stats
array_1 = [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array_2 = [23, 35, 14, 11, 2]
print("array 1 : ", array_1)
print("array 2 : ", array_2)
print("SEM for array 1 : ", stats.sem(array_1, axis=1, ddof=1))
print("SEM for array 2 : ", stats.sem(array_2, axis=0, ddof=0))
Production :
array 1 : [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array 2 : [23, 35, 14, 11, 2]
SEM for array 1 : [2.22261108 8.14002457]
SEM for array 2 : 5.019960159204453
Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.
LinkedIn