Tracé quantile-quantile en Python
-
Tracé quantile-quantile avec le package
statsmodels
en Python -
Tracé quantile-quantile avec le package
openturns
en Python
Ce didacticiel présentera les méthodes pour dessiner des tracés quantile-quantile en Python.
Tracé quantile-quantile avec le package statsmodels
en Python
Un graphique quantile-quantile est utilisé pour évaluer si nos données sont conformes ou non à une distribution particulière. Il peut être utilisé pour vérifier si l’ensemble de données donné est normalement distribué ou non. Nous pouvons utiliser le paquet statsmodels
pour tracer un graphique quantile-quantile en Python. La commande pour installer statsmodels
est donnée ci-dessous.
pip install statsmodels
La fonction qqplot()
à l’intérieur du package statsmodels
trace des graphiques quantile-quantile. Cette fonction prend nos données et le type de ligne à tracer. L’extrait de code suivant nous montre comment tracer un graphique quantile-quantile avec le package statsmodels
.
import numpy as np
import statsmodels.api as smi
import pylab
sample_data = np.random.normal(0, 1, 1000)
smi.qqplot(sample_data, line="r")
pylab.show()
Production:
Nous avons tracé un graphique quantile-quantile avec la fonction smi.qqplot(sample_data, line = "r")
dans le package statsmodels
dans le code ci-dessus. Nous avons généré nos données normales contenant 1000 entrées avec la fonction sample_data = np.random.normal(0,1, 1000)
. Au final, nous avons utilisé le package pylab
pour afficher notre graphe avec la fonction pylab.show()
.
Cette méthode nous donne un contrôle complet sur le type de ligne de référence à tracer. Dans le graphique ci-dessus, nous définissons la ligne de référence comme une ligne de régression.
Tracé quantile-quantile avec le package openturns
en Python
Une autre méthode pour tracer un graphe quantile-quantile en Python consiste à utiliser le paquet openturns
. C’est un package externe, nous devons donc l’installer avant de l’utiliser dans notre code. La commande pour installer le paquet openturns
est donnée ci-dessous.
pip install openturns
La fonction VisualTest.DrawQQplot()
est utilisée pour tracer des graphiques quantile-quantile à l’intérieur du package openturns
. Le premier paramètre de cette fonction doit être un échantillon de données ; le deuxième paramètre peut être soit un autre échantillon de données, soit une distribution suivie d’un autre troisième paramètre spécifiant le nombre de points. Pour cet exemple, nous allons tracer un échantillon de distribution normale par rapport à un échantillon de distribution uniforme. L’extrait de code suivant nous montre comment tracer un graphique quantile-quantile avec le package openturns
.
import openturns as ot
x = ot.Normal().getSample(1000000)
y = ot.Uniform().getSample(1000000)
g = ot.VisualTest.DrawQQplot(x, y)
g
Production:
Nous avons testé un échantillon d’une distribution normale par rapport à un échantillon d’une distribution uniforme avec la fonction VisualTest.DrawQQplot(x, y)
dans le package openturns
dans le code ci-dessus. Nous avons généré nos exemples de données à partir d’une distribution normale contenant un million d’entrées avec x = ot.Normal().getSample(1000000)
. Nous avons généré nos exemples de données à partir d’une distribution uniforme contenant un million d’entrées avec y = ot.Uniform().getSample(1000000)
.
Cette méthode ne permet pas de contrôler la ligne de référence/test.
Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.
LinkedIn