SciPy stats.kurtosis Funktion
Kurtosis
in der Statistik hilft dabei, den Unterschied zwischen der Schwere der Schwänze einer bestimmten Verteilung und der Schwere der Schwänze einer Normalverteilung gegebener Daten herauszufinden. Dieses statistische Maß hilft also festzustellen, ob die Enden einer bestimmten Verteilung aus Extremwerten bestehen.
Neben diesem statistischen Maß gibt es eine weitere Metrik, die als excess kurtosis
bekannt ist. Dieses Maß hilft beim Vergleich der Kurtosis einer bestimmten Verteilung mit der Kurtosis einer Normalverteilung. Überschüssige Kurtosis kann wie folgt berechnet werden.
Excess Kurtosis = Kurtosis - 3
Es gibt drei Arten von Kurtosis. Die Art der Kurtose
wird durch die Exzess-Kurtosis
einer bestimmten Verteilung definiert.
- Mesokurtik - Wenn bestimmte Daten eine mesokurtische Verteilung darstellen, zeigen sie eine überschüssige Kurtosis, die null oder nahe null ist. Mit anderen Worten, gegebene Daten folgen einer mesokurtischen Verteilung, wenn sie eine Normalverteilung zeigen.
- Leptokurtic - Leptokurtic zeigt eine positive exzessive Kurtosis. Die leptokurtische Verteilung stellt auf beiden Seiten sehr starke Ausläufer dar, was bedeutet, dass einige Werte einen ungewöhnlichen Abstand zu anderen Werten in den Daten haben, auch bekannt als
Ausreißer
. - Platykurtic - Die platykurtische Verteilung repräsentiert eine negative übermäßige Kurtosis. Die Kurtosis zeigt eine Verteilung mit flachen Ausläufern. Flache Enden in einer Verteilung weisen darauf hin, dass kleine Ausreißer vorhanden sind.
Die scipy.stats.kurtosis
-Funktion
Die Funktion scipy.stats.kurtosis
der Bibliothek SciPy
hilft bei der Berechnung der kurtosis
eines gegebenen Datensatzes.
Syntax
scipy.stats.kurtosis(a, axis=0, fisher=True, bias=True, nan_policy="raise")
Parameter
a (Array) |
Es definiert die Eingabedaten, für die die Kurtosis berechnet wird. | |
axis (int) |
Es definiert die Achse, entlang der die Kurtosis der Eingabedaten berechnet wird. Der Standardwert dieses Parameters ist 0 . Wenn der Wert None ist, dann rechnet die Funktion einfach über die gesamten Eingabedaten. |
|
fisher (bool) |
Ein boolescher Parameter. Wenn der Wert dieses Parameters True ist, dann wird Fishers Definition verwendet, d.h. normal ==> 0.0 . Und wenn der Wert des Parameters False ist, dann wird die Definition von Pearson verwendet, dh normal ==> 3.0 . |
|
bias (bool) |
Dies ist ebenfalls ein boolescher Parameter. Wenn der Wert dieses Parameters False ist, werden alle Berechnungen um die statistische Verzerrung korrigiert. |
|
nan_policy |
Dieser Parameter entscheidet, wie mit NaN-Werten in den Eingabedaten umgegangen wird. Im Parameter gibt es drei Entscheidungsparameter, propagate , raise , omit . propagate gibt einfach den NaN-Wert zurück, raise gibt einen Fehler zurück und omit ignoriert einfach die NaN-Werte und die Funktion fährt mit der Berechnung fort. Diese Entscheidungsparameter werden in einfachen Anführungszeichen '' definiert. Der Standardwert dieses Parameters ist propagate . |
Beispiel Kurtosis
from scipy.stats import kurtosis
import numpy as np
import pylab as p
a = np.linspace(-10, 10, 2000)
b = 1 / (np.sqrt(2 * np.pi)) * np.exp(-0.5 * (a) ** 2)
p.plot(a, b, ".")
print("Kurtosis value for the given normal distribution :", kurtosis(b))
print("Kurtosis value for the given normal distribution :", kurtosis(b, fisher=False))
print(
"Kurtosis value for the given normal distribution :",
kurtosis(b, fisher=True, bias=False),
)
Ausgabe:
Kurtosis value for the given normal distribution : 3.399361267205304
Kurtosis value for the given normal distribution : 6.399361267205304
Kurtosis value for the given normal distribution : 3.4108810035523636
Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.
LinkedIn