Función SciPy stats.sem
SEM
en estadística significa Error estándar de la media
. SEM
se calcula calculando la desviación estándar de los datos dados y luego dividiéndola por la raíz cuadrada del tamaño de los datos dados. Este error estándar ayuda a determinar la precisión de la media aritmética de los datos de la muestra. Esto se hace averiguando la variabilidad entre cada muestra en los datos dados.
Entonces, a medida que aumenta el tamaño de los datos de muestra dados, el valor de SEM
disminuye.
La función scipy.stats.sem
La función scipy.stats.sem
de la biblioteca SciPy
ayuda a calcular el SEM
, es decir, el Error Medio Estándar
de los datos de entrada dados.
Sintaxis
scipy.stats.sem(a, axis=0, ddof=0, nan_policy="propagate")
Parámetro
a (array) |
Este parámetro define los datos de entrada para los que se calcula el valor SEM . |
|
axis (int) |
Este parámetro define el eje a lo largo del cual se calcula el valor SEM de los datos de entrada. El valor por defecto de este parámetro es 0 . Si el valor es None , entonces la función simplemente calcula sobre todos los datos de entrada. |
|
ddof (int) |
ddof significa grados de libertad delta . Este parámetro define el número de grados de libertad que ayuda a ajustar el sesgo con muestras de entrada limitadas en relación con la varianza de la población. El valor por defecto de este parámetro es 1 . |
|
nan_policy |
Este parámetro decide cómo tratar cuando hay valores NaN en los datos de entrada. Hay tres parámetros de decisión en el parámetro, propagate , raise , omit . El parámetro propagate simplemente devuelve el valor NaN, raise devuelve un error y omit simplemente ignora los valores NaN y la función continúa con el cálculo. Estos parámetros de decisión se definen entre comillas simples '' . El valor por defecto de este parámetro es propagate . |
Todos los parámetros excepto el parámetro a (array)
son opcionales. Esto significa que no es necesario definir todos los parámetros cada vez que se utiliza esta función.
Ejemplo de error estándar de la media
import numpy as np
from scipy import stats
array_1 = [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array_2 = [23, 35, 14, 11, 2]
print("array 1 : ", array_1)
print("array 2 : ", array_2)
print("SEM for array 1 : ", stats.sem(array_1, axis=1, ddof=1))
print("SEM for array 2 : ", stats.sem(array_2, axis=0, ddof=0))
Producción:
array 1 : [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array 2 : [23, 35, 14, 11, 2]
SEM for array 1 : [2.22261108 8.14002457]
SEM for array 2 : 5.019960159204453
Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.
LinkedIn