SciPy stats.sem Funktion

Lakshay Kapoor 30 Januar 2023
  1. Die scipy.stats.sem Funktion
  2. Beispiel für Standardfehler des Mittelwerts
SciPy stats.sem Funktion

SEM steht in der Statistik für Standard Error of the Mean. SEM wird berechnet, indem die Standardabweichung der gegebenen Daten berechnet und dann durch die Quadratwurzel der Größe der gegebenen Daten dividiert wird. Dieser Standardfehler hilft dabei, die Genauigkeit des arithmetischen Mittels der Stichprobendaten herauszufinden. Dies geschieht, indem die Variabilität zwischen den einzelnen Proben in den gegebenen Daten ermittelt wird.

Mit zunehmender Größe der gegebenen Stichprobendaten nimmt also der Wert des SEM ab.

Die scipy.stats.sem Funktion

Die Funktion scipy.stats.sem der Bibliothek SciPy hilft bei der Berechnung des SEM, d.h. Standard Mean Error der gegebenen Eingabedaten.

Syntax

scipy.stats.sem(a, axis=0, ddof=0, nan_policy="propagate")

Parameter

a (Array) Dieser Parameter definiert die Eingangsdaten, für die der SEM-Wert berechnet wird.
axis (int) Dieser Parameter definiert die Achse, entlang der der SEM-Wert der Eingabedaten berechnet wird. Der Standardwert dieses Parameters ist 0. Wenn der Wert None ist, dann rechnet die Funktion einfach über die gesamten Eingabedaten.
ddof (int) ddof steht für Delta-Freiheitsgrade. Dieser Parameter definiert die Anzahl der Freiheitsgrade, die bei der Anpassung der Verzerrung mit begrenzten Eingabestichproben relativ zur Varianz der Grundgesamtheit hilfreich sind. Der Standardwert dieses Parameters ist 1.
nan_policy Dieser Parameter entscheidet, wie mit NaN-Werten in den Eingabedaten umgegangen wird. Im Parameter gibt es drei Entscheidungsparameter, propagate, raise, omit. propagate gibt einfach den NaN-Wert zurück, raise gibt einen Fehler zurück und omit ignoriert einfach die NaN-Werte und die Funktion fährt mit der Berechnung fort. Diese Entscheidungsparameter werden in einfachen Anführungszeichen '' definiert. Der Standardwert dieses Parameters ist propagate.

Alle Parameter außer dem Parameter a (array) sind optional. Das bedeutet, dass bei Verwendung dieser Funktion nicht alle Parameter definiert werden müssen.

Beispiel für Standardfehler des Mittelwerts

import numpy as np
from scipy import stats

array_1 = [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]

array_2 = [23, 35, 14, 11, 2]

print("array 1 : ", array_1)
print("array 2 : ", array_2)

print("SEM for array 1 : ", stats.sem(array_1, axis=1, ddof=1))

print("SEM for array 2 : ", stats.sem(array_2, axis=0, ddof=0))

Ausgabe:

array 1 :  [[15, 12, 17, 11, 4], [43, 5, 2, 36, 21]]
array 2 :  [23, 35, 14, 11, 2]
SEM for array 1 :  [2.22261108 8.14002457]
SEM for array 2 :  5.019960159204453
Lakshay Kapoor avatar Lakshay Kapoor avatar

Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.

LinkedIn

Verwandter Artikel - SciPy Stats