Pandas DataFrame.corr() Funktion

Minahil Noor 30 Januar 2023
  1. Syntax von pandas.DataFrame.corr():
  2. Beispiel-Codes: DataFrame.corr() Methode zur Ermittlung der Korrelationsmatrix mit der Pearson-Methode
  3. Beispielcodes: Methode DataFrame.corr() zur Ermittlung der Korrelationsmatrix mit der Methode kendall
  4. Beispiel-Codes: Methode DataFrame.corr() zur Ermittlung der Korrelationsmatrix mit der Methode spearman mit mehreren Spaltenwertepaaren
Pandas DataFrame.corr() Funktion

Die Python Pandas DataFrame.corr() Funktion findet die Korrelation zwischen den Spalten des DataFrame.

Syntax von pandas.DataFrame.corr():

DataFrame.corr(method="pearson", min_periods=1)

Parameter

method Das ist die Methode der Korrelation. Es kann pearson, kendall und spearman sein. Pearson ist die Voreinstellung.
min_periods Dieser Parameter gibt die minimale Anzahl von Beobachtungen an, die pro Spaltenpaar erforderlich sind, um ein gültiges Ergebnis zu erhalten. Er ist derzeit nur für die Korrelationen pearson und spearman verfügbar.

Zurück

Es wird der Dataframe mit der berechneten Korrelation zwischen den Spalten zurückgegeben.

Beispiel-Codes: DataFrame.corr() Methode zur Ermittlung der Korrelationsmatrix mit der Pearson-Methode

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)

Ausgabe:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance         1.00000        -0.61515
Obtained Marks    -0.61515         1.00000

Die Funktion hat die Korrelationsmatrix zurückgegeben. Sie hat die nicht-numerische Spalte ignoriert. Sie hat die Korrelation mit der Pearson-Methode und einem Wertepaar der Spalten (min_position= 1) berechnet.

Beispielcodes: Methode DataFrame.corr() zur Ermittlung der Korrelationsmatrix mit der Methode kendall

Um die Korrelation mit der Kendall-Methode zu finden, rufen wir die Funktion corr() mit method="kendall" auf.

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)

Ausgabe:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.4
Obtained Marks        -0.4             1.0

Die Funktion hat die Korrelationsmatrix zurückgegeben. Sie hat die Korrelation mit der Kendall-Methode und einem Wertepaar der Spalten (min_position= 1) berechnet.

Beispiel-Codes: Methode DataFrame.corr() zur Ermittlung der Korrelationsmatrix mit der Methode spearman mit mehreren Spaltenwertepaaren

Jetzt werden wir den Wert von min_periods auf 2 setzen, indem wir die spearman Methode verwenden. Der Parameter min_periods ist nur für die Methoden pearson und spearman verfügbar.

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)

Ausgabe:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.5
Obtained Marks        -0.5             1.0

Die Funktion hat nun die Korrelation über 2 Wertepaare der Spalten berechnet.

Verwandter Artikel - Pandas DataFrame