Función Pandas DataFrame.corr()

Minahil Noor 30 enero 2023
  1. Sintaxis de pandas.DataFrame.corr():
  2. Códigos de ejemplo: DataFrame.corr() Método para encontrar el array de correlación usando el método de Pearson
  3. Códigos de ejemplo: Método DataFrame.corr() para encontrar el array de correlación utilizando el método kendall
  4. Códigos de ejemplo: Método DataFrame.corr() para encontrar el array de correlación utilizando el método spearman con más pares de valores de columna
Función Pandas DataFrame.corr()

La función Pandas DataFrame.corr() encuentra la correlación entre las columnas del DataFrame.

Sintaxis de pandas.DataFrame.corr():

DataFrame.corr(method="pearson", min_periods=1)

Parámetros

method Es el método de correlación. Puede ser pearson, kendall y spearman. pearson es el método por defecto.
min_periods Este parámetro especifica el número mínimo de observaciones necesarias por par de columnas para tener un resultado válido. Actualmente sólo está disponible para la correlación pearson y spearman.

Retorna

Devuelve el Dataframe con la correlación calculada entre columnas.

Códigos de ejemplo: DataFrame.corr() Método para encontrar el array de correlación usando el método de Pearson

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)

Producción:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance         1.00000        -0.61515
Obtained Marks    -0.61515         1.00000

La función ha devuelto el array de correlación. Ha ignorado la columna no numérica. Ha calculado la correlación usando el método Pearson y un par de valores de columnas (min_position= 1).

Códigos de ejemplo: Método DataFrame.corr() para encontrar el array de correlación utilizando el método kendall

Para encontrar la correlación usando el método Kendall, llamaremos a la función corr() para usar method= "kendall".

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)

Resultado:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.4
Obtained Marks        -0.4             1.0

La función ha devuelto el array de correlación. Ha calculado la correlación utilizando el método de Kendall y un par de valores de columnas (min_position= 1).

Códigos de ejemplo: Método DataFrame.corr() para encontrar el array de correlación utilizando el método spearman con más pares de valores de columna

Ahora estableceremos el valor de min_periods a 2 utilizando el método spearman. El parámetro min_periods sólo está disponible para los métodos pearson y spearman.

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)

Resultado:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.5
Obtained Marks        -0.5             1.0

Ahora la función ha calculado la correlación usando 2 pares de valores de columnas.

Artículo relacionado - Pandas DataFrame