Fonction Pandas DataFrame.corr()
-
Syntaxe de la fonction
pandas.DataFrame.corr()
: -
Exemples de codes :
DataFrame.corr()
Méthode pour trouver la matrice de corrélation en utilisant la méthode de Pearson -
Exemples de codes :
DataFrame.corr()
Méthode pour trouver la matrice de corrélation en utilisant la méthodekendall
-
Exemples de codes :
DataFrame.corr()
Méthode pour trouver la matrice de corrélation en utilisant la méthodespearman
avec plus de paires de valeurs de colonnes
La fonction Python Pandas DataFrame.corr()
trouve la corrélation entre les colonnes du DataFrame.
Syntaxe de la fonction pandas.DataFrame.corr()
:
DataFrame.corr(method="pearson", min_periods=1)
Paramètres
method |
C’est la méthode de corrélation. Elle peut être pearson , kendall et spearman . Par défaut, c’est pearson . |
min_periods |
Ce paramètre spécifie le nombre minimum d’observations requises par paire de colonnes pour obtenir un résultat valable. Il n’est actuellement disponible que pour les corrélations pearson et spearman . |
Retourne
Il renvoie la Dataframe avec la corrélation calculée entre les colonnes.
Exemples de codes : DataFrame.corr()
Méthode pour trouver la matrice de corrélation en utilisant la méthode de Pearson
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)
Production :
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.00000 -0.61515
Obtained Marks -0.61515 1.00000
La fonction a renvoyé la matrice de corrélation. Elle a ignoré la colonne non numérique. Elle a calculé la corrélation en utilisant la méthode Pearson
et une paire de valeurs de colonnes (min_position= 1).
Exemples de codes : DataFrame.corr()
Méthode pour trouver la matrice de corrélation en utilisant la méthode kendall
Pour trouver la corrélation en utilisant la méthode Kendall, nous appellerons la fonction corr()
pour utiliser method="kendall"
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)
Production :
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.4
Obtained Marks -0.4 1.0
La fonction a renvoyé la matrice de corrélation. Elle a calculé la corrélation en utilisant la méthode de Kendall et une paire de valeurs de colonnes (min_position= 1
).
Exemples de codes : DataFrame.corr()
Méthode pour trouver la matrice de corrélation en utilisant la méthode spearman
avec plus de paires de valeurs de colonnes
Maintenant, nous allons fixer la valeur de min_periods
à 2
en utilisant la méthode spearman
. Le paramètre min_periods
n’est disponible que pour les méthodes pearson
et spearman
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)
Production :
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.5
Obtained Marks -0.5 1.0
La fonction a maintenant calculé la corrélation en utilisant 2 paires de valeurs de colonnes.