Fonction SciPy stats.kurtosis
Kurtosis
dans les statistiques aide à trouver la différence entre la lourdeur des queues d’une distribution particulière et la lourdeur des queues d’une distribution normale d’une donnée donnée. Ainsi, cette mesure statistique permet d’identifier si les queues d’une distribution particulière consistent en une valeur extrême.
Parallèlement à cette mesure statistique, il existe une autre métrique connue sous le nom de kurtosis excessif
. Cette mesure aide à comparer l’aplatissement d’une distribution particulière avec l’aplatissement d’une distribution normale. L’aplatissement excessif peut être calculé comme ci-dessous.
Excess Kurtosis = Kurtosis - 3
Il existe trois types de kurtosis
. Le type de kurtosis
est défini par l’excès de kurtosis d’une distribution spécifique.
- Mésokurtique - Si une donnée donnée représente une distribution mésokurtique, elle montre un excès d’aplatissement nul ou proche de zéro. En d’autres termes, une donnée donnée suit une distribution mésokurtique si elle présente une distribution normale.
- Leptokurtic - Leptokurtic montre un excès d’aplatissement positif. La distribution leptokurtique représente des queues très lourdes des deux côtés, ce qui dénote certaines valeurs à une distance inhabituelle d’autres valeurs dans les données, également appelées
outliers
. - Platykurtic - La distribution platykurtique représente un excès d’aplatissement négatif. Le kurtosis montre une distribution qui a des queues plates. Les queues plates dans une distribution indiquent la présence de petites valeurs aberrantes.
La fonction scipy.stats.kurtosis
La fonction scipy.stats.kurtosis
de la bibliothèque SciPy
aide à calculer le kurtosis
d’un jeu de données donné.
Syntaxe
scipy.stats.kurtosis(a, axis=0, fisher=True, bias=True, nan_policy="raise")
Paramètres
a (tableau) |
Il définit les données d’entrée pour lesquelles le kurtosis est calculé. | |
axis (int) |
Il définit l’axe le long duquel le kurtosis des données d’entrée est calculé. La valeur par défaut de ce paramètre est 0 . Si la valeur est None , alors la fonction calcule simplement sur l’ensemble des données d’entrée. |
|
fisher (bool) |
Un paramètre booléen. Si la valeur de ce paramètre est True , alors la définition de Fisher, c’est-à-dire normal ==> 0.0 est utilisée. Et si la valeur de ce paramètre est False , alors la définition de Pearson, c’est-à-dire normal ==> 3.0 , est utilisée. |
|
bias (bool) |
Il s’agit également d’un paramètre booléen. Si la valeur de ce paramètre est False , alors tous les calculs sont corrigés pour le biais statistique. |
|
nan_policy |
Ce paramètre décide de la façon de gérer les valeurs NaN dans les données d’entrée. Il y a trois paramètres de décision dans le paramètre, propagate , raise , omit . propagate renvoie simplement la valeur NaN, raise renvoie une erreur et omit ignore simplement les valeurs NaN et la fonction continue le calcul. Ces paramètres de décision sont définis entre guillemets simples '' . La valeur par défaut de ce paramètre est propagate . |
Exemple d’aplatissement
from scipy.stats import kurtosis
import numpy as np
import pylab as p
a = np.linspace(-10, 10, 2000)
b = 1 / (np.sqrt(2 * np.pi)) * np.exp(-0.5 * (a) ** 2)
p.plot(a, b, ".")
print("Kurtosis value for the given normal distribution :", kurtosis(b))
print("Kurtosis value for the given normal distribution :", kurtosis(b, fisher=False))
print(
"Kurtosis value for the given normal distribution :",
kurtosis(b, fisher=True, bias=False),
)
Production :
Kurtosis value for the given normal distribution : 3.399361267205304
Kurtosis value for the given normal distribution : 6.399361267205304
Kurtosis value for the given normal distribution : 3.4108810035523636
Lakshay Kapoor is a final year B.Tech Computer Science student at Amity University Noida. He is familiar with programming languages and their real-world applications (Python/R/C++). Deeply interested in the area of Data Sciences and Machine Learning.
LinkedIn