Función Pandas DataFrame.corr()
-
Sintaxis de
pandas.DataFrame.corr()
: -
Códigos de ejemplo:
DataFrame.corr()
Método para encontrar el array de correlación usando el método de Pearson -
Códigos de ejemplo: Método
DataFrame.corr()
para encontrar el array de correlación utilizando el métodokendall
-
Códigos de ejemplo: Método
DataFrame.corr()
para encontrar el array de correlación utilizando el métodospearman
con más pares de valores de columna
La función Pandas DataFrame.corr()
encuentra la correlación entre las columnas del DataFrame.
Sintaxis de pandas.DataFrame.corr()
:
DataFrame.corr(method="pearson", min_periods=1)
Parámetros
method |
Es el método de correlación. Puede ser pearson , kendall y spearman . pearson es el método por defecto. |
min_periods |
Este parámetro especifica el número mínimo de observaciones necesarias por par de columnas para tener un resultado válido. Actualmente sólo está disponible para la correlación pearson y spearman . |
Retorna
Devuelve el Dataframe con la correlación calculada entre columnas.
Códigos de ejemplo: DataFrame.corr()
Método para encontrar el array de correlación usando el método de Pearson
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)
Producción:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.00000 -0.61515
Obtained Marks -0.61515 1.00000
La función ha devuelto el array de correlación. Ha ignorado la columna no numérica. Ha calculado la correlación usando el método Pearson
y un par de valores de columnas (min_position= 1).
Códigos de ejemplo: Método DataFrame.corr()
para encontrar el array de correlación utilizando el método kendall
Para encontrar la correlación usando el método Kendall, llamaremos a la función corr()
para usar method= "kendall"
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)
Resultado:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.4
Obtained Marks -0.4 1.0
La función ha devuelto el array de correlación. Ha calculado la correlación utilizando el método de Kendall y un par de valores de columnas (min_position= 1
).
Códigos de ejemplo: Método DataFrame.corr()
para encontrar el array de correlación utilizando el método spearman
con más pares de valores de columna
Ahora estableceremos el valor de min_periods
a 2
utilizando el método spearman
. El parámetro min_periods
sólo está disponible para los métodos pearson
y spearman
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)
Resultado:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.5
Obtained Marks -0.5 1.0
Ahora la función ha calculado la correlación usando 2 pares de valores de columnas.