Función SciPy scipy.stats.sem
-
Sintaxis de
scipy.stats.sem()
: -
Códigos de ejemplo:
scipy.stats.sem()
Método para encontrar la media sinconjunto de ejes
-
Códigos de ejemplo: Establezca
axis=None
en la funciónscipy.stats.sem()
-
Códigos de ejemplo: Establezca
axis=1
en la funciónscipy.stats.sem()
-
Códigos de ejemplo: establecer
ddof=0
en la funciónscipy.stats.sem()
La función Python Scipy scipy.stats.sem()
calcula el error estándar de la media de los datos proporcionados. El error estándar de la media nos muestra qué tan lejos está la media muestreada de la media de la población real.
Sintaxis de scipy.stats.sem()
:
scipy.stats.sem(a, axis=0, ddof=1)
Parámetros
a |
Una matriz que tiene elementos cuyo error estándar se va a calcular. |
axis |
Un parámetro opcional. El eje a lo largo del cual se calculará el error estándar de la media. Por defecto, axis=0(eje horizontal) |
ddof |
Un parámetro opcional. Representa el grado de libertad que es igual al tamaño de la muestra menos el número de parámetros que deben calcularse durante la operación. Su valor por defecto es 1. |
Regreso
Devuelve el error estándar de la media. El valor puede ser un array de elementos o un solo número flotante en función de los parámetros y el grado de libertad utilizados.
Códigos de ejemplo: scipy.stats.sem()
Método para encontrar la media sin conjunto de ejes
import numpy as np
import scipy
from scipy import stats
arr = np.array([[2, 5, 6, 8], [3, 7, 3, 0], [1, 1, 4, 4], [9, 5, 0, 5], [6, 4, 2, 2]])
result = scipy.stats.sem(arr)
print("The standard error of given data is:\n", result)
Producción:
The standard error of given data is:
[1.46287388 0.9797959 1. 1.356466 ]
Aquí, se crea un array arr
con datos multidimensionales. La matriz se pasa como argumento a la función stats.sem
, que produce la salida, y se almacena en la variable resultado
.
Dado que no se define ningún parámetro de eje en esta condición, la operación media tiene lugar en el eje horizontal por defecto.
Cada uno de los cinco elementos de la columna se trata a la vez. Al principio, se calcula su desviación estándar y luego se usa la fórmula del error estándar. Por ejemplo, el primer elemento en el valor de la matriz de salida 1.46287388
es el resultado del primer elemento de la columna 2, 3, 1, 9, 6
.
Códigos de ejemplo: Establezca axis=None
en la función scipy.stats.sem()
import numpy as np
import scipy
from scipy import stats
arr = np.array([[2, 5, 6, 8], [3, 7, 3, 0], [1, 1, 4, 4], [9, 5, 0, 5], [6, 4, 2, 2]])
result = scipy.stats.sem(arr, axis=None)
print("The standard error of given data is:\n", result)
Producción:
The standard error of given data is:
0.5725060330640515
Aquí, la salida muestra un solo valor flotante porque cada vez que el eje se establece en None
, la operación se lleva a cabo en todo el elemento de la matriz en lugar de en un campo de fila o columna en particular.
Códigos de ejemplo: Establezca axis=1
en la función scipy.stats.sem()
import numpy as np
import scipy
from scipy import stats
arr = np.array([[2, 5, 6, 8], [3, 7, 3, 0], [1, 1, 4, 4], [9, 5, 0, 5], [6, 4, 2, 2]])
result = scipy.stats.sem(arr, axis=1)
print("The standard error of given data is:\n", result)
Producción:
The standard error of given data is:
[1.25 1.43614066 0.8660254 1.8427787 0.95742711]
Aquí, el eje se establece en 1
, lo que significa que la operación tomará el eje vertical, produciendo así cinco elementos en el campo de matriz de salida.
Códigos de ejemplo: establecer ddof=0
en la función scipy.stats.sem()
import numpy as np
import scipy
from scipy import stats
arr = np.array([[2, 5, 6, 8], [3, 7, 3, 0], [1, 1, 4, 4], [9, 5, 0, 5], [6, 4, 2, 2]])
result = scipy.stats.sem(arr, axis=1, ddof=0)
print("The standard error of given data is:\n", result)
Producción:
The standard error of given data is:
[1.08253175 1.2437343 0.75 1.59589317 0.8291562 ]
Aquí, la operación del eje es similar al ejemplo anterior, pero ddof=0
trae algunos cambios. Sabemos que antes de calcular el error estándar, necesitamos tener el valor de las desviaciones estándar. Para calcular la desviación estándar, la media de las diferencias al cuadrado se evalúa utilizando número de tamaño de muestra menos ddof
. Así, por defecto, el valor de ddof
es 1, pero siempre que se mantenga en 0, el valor de errores estándar
disminuye.
Cada vez que los datos de la muestra crecen, el error estándar de la media disminuye en referencia a la desviación estándar. Es decir, con datos de muestra más grandes, la media de la muestra calcula la media de la población real con mayor precisión y precisión.