Funzione Pandas DataFrame.corr()
-
Sintassi di
pandas.DataFrame.corr()
: -
Codici di esempio: metodo
DataFrame.corr()
per trovare la matrice di correlazione utilizzando il metodo Pearson -
Codici di esempio: metodo
DataFrame.corr()
per trovare la matrice di correlazione utilizzando il metodokendall
-
Codici di esempio: Metodo
DataFrame.corr()
per trovare la matrice di correlazione utilizzando il metodospearman
con più coppie di valori di colonna
La funzione Python Pandas DataFrame.corr()
trova la correlazione tra le colonne del dataframe.
Sintassi di pandas.DataFrame.corr()
:
DataFrame.corr(method="pearson", min_periods=1)
Parametri
method |
È il metodo di correlazione. Può essere pearson , kendall e spearman . pearson è l’impostazione predefinita. |
min_periods |
Questo parametro specifica il numero minimo di osservazioni richieste per ogni coppia di colonne per avere un risultato valido. Attualmente è disponibile solo per la correlazione pearson e spearman . |
Ritorno
Restituisce il Dataframe con la correlazione calcolata tra le colonne.
Codici di esempio: metodo DataFrame.corr()
per trovare la matrice di correlazione utilizzando il metodo Pearson
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)
Produzione:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.00000 -0.61515
Obtained Marks -0.61515 1.00000
La funzione ha restituito la matrice di correlazione. Ha ignorato la colonna non numerica. Ha calcolato la correlazione utilizzando il metodo Pearson
e una coppia di valori di colonne (min_position= 1
).
Codici di esempio: metodo DataFrame.corr()
per trovare la matrice di correlazione utilizzando il metodo kendall
Per trovare la correlazione usando il metodo Kendall, chiameremo la funzione corr()
per usare method= "kendall"
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)
Produzione:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.4
Obtained Marks -0.4 1.0
La funzione ha restituito la matrice di correlazione. Ha calcolato la correlazione utilizzando il metodo Kendall e una coppia di valori di colonne (min_position= 1
).
Codici di esempio: Metodo DataFrame.corr()
per trovare la matrice di correlazione utilizzando il metodo spearman
con più coppie di valori di colonna
Ora imposteremo il valore di min_periods
a 2
usando il metodo spearman
. Il parametro min_periods
è disponibile solo per i metodi pearson
e spearman
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)
Produzione:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.5
Obtained Marks -0.5 1.0
Ora la funzione ha calcolato la correlazione utilizzando 2 coppie di valori di colonne.