Funzione Pandas DataFrame.corr()

Minahil Noor 30 gennaio 2023
  1. Sintassi di pandas.DataFrame.corr():
  2. Codici di esempio: metodo DataFrame.corr() per trovare la matrice di correlazione utilizzando il metodo Pearson
  3. Codici di esempio: metodo DataFrame.corr() per trovare la matrice di correlazione utilizzando il metodo kendall
  4. Codici di esempio: Metodo DataFrame.corr() per trovare la matrice di correlazione utilizzando il metodo spearman con più coppie di valori di colonna
Funzione Pandas DataFrame.corr()

La funzione Python Pandas DataFrame.corr() trova la correlazione tra le colonne del dataframe.

Sintassi di pandas.DataFrame.corr():

DataFrame.corr(method="pearson", min_periods=1)

Parametri

method È il metodo di correlazione. Può essere pearson, kendall e spearman. pearson è l’impostazione predefinita.
min_periods Questo parametro specifica il numero minimo di osservazioni richieste per ogni coppia di colonne per avere un risultato valido. Attualmente è disponibile solo per la correlazione pearson e spearman.

Ritorno

Restituisce il Dataframe con la correlazione calcolata tra le colonne.

Codici di esempio: metodo DataFrame.corr() per trovare la matrice di correlazione utilizzando il metodo Pearson

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)

Produzione:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance         1.00000        -0.61515
Obtained Marks    -0.61515         1.00000

La funzione ha restituito la matrice di correlazione. Ha ignorato la colonna non numerica. Ha calcolato la correlazione utilizzando il metodo Pearson e una coppia di valori di colonne (min_position= 1).

Codici di esempio: metodo DataFrame.corr() per trovare la matrice di correlazione utilizzando il metodo kendall

Per trovare la correlazione usando il metodo Kendall, chiameremo la funzione corr() per usare method= "kendall".

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)

Produzione:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.4
Obtained Marks        -0.4             1.0

La funzione ha restituito la matrice di correlazione. Ha calcolato la correlazione utilizzando il metodo Kendall e una coppia di valori di colonne (min_position= 1).

Codici di esempio: Metodo DataFrame.corr() per trovare la matrice di correlazione utilizzando il metodo spearman con più coppie di valori di colonna

Ora imposteremo il valore di min_periods a 2 usando il metodo spearman. Il parametro min_periods è disponibile solo per i metodi pearson e spearman.

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)

Produzione:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.5
Obtained Marks        -0.5             1.0

Ora la funzione ha calcolato la correlazione utilizzando 2 coppie di valori di colonne.

Articolo correlato - Pandas DataFrame