Pandas DataFrame.corr() Função
-
Sintaxe de
pandas.DataFrame.corr()
: -
Códigos de exemplo:
DataFrame.corr()
Método para encontrar a matriz de correlação utilizando o método Pearson -
Códigos de exemplo:
DataFrame.corr()
Método para encontrar a Matriz de Correlação utilizando o métodokendall
-
Códigos de exemplo:
DataFrame.corr()
Método para encontrar a matriz de correlação utilizando o métodospearman
com mais pares de valores de colunas
Python Pandas DataFrame.corr()
função encontra a correlação entre as colunas da moldura de dados.
Sintaxe de pandas.DataFrame.corr()
:
DataFrame.corr(method="pearson", min_periods=1)
Parâmetros
method |
É o método de correlação. Pode ser pearson , kendall e spearman . O pearson é o padrão. |
min_periods |
Este parâmetro especifica o número mínimo de observações necessárias por par de colunas para ter um resultado válido. Actualmente só está disponível para as correlações pearson' e spearman'. |
Devolver
Retorna o Dataframe com a correlação computorizada entre colunas.
Códigos de exemplo: DataFrame.corr()
Método para encontrar a matriz de correlação utilizando o método Pearson
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)
Resultado:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.00000 -0.61515
Obtained Marks -0.61515 1.00000
A função devolveu a matriz de correlação. Ignorou a coluna não-numérica. Calculou a correlação utilizando o método Pearson
e um par de valores de colunas (min_position= 1).
Códigos de exemplo: DataFrame.corr()
Método para encontrar a Matriz de Correlação utilizando o método kendall
Para encontrar a correlação utilizando o método Kendall, chamaremos a função corr()
para utilizar method= "kendall"
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)
Resultado:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.4
Obtained Marks -0.4 1.0
A função devolveu a matriz de correlação. Ela calculou a correlação utilizando o método de Kendall e um par de valores de colunas (min_position= 1
).
Códigos de exemplo: DataFrame.corr()
Método para encontrar a matriz de correlação utilizando o método spearman
com mais pares de valores de colunas
Agora vamos definir o valor de min_periods
a 2
utilizando o método spearman
. O parâmetro min_periods
só está disponível para os métodos pearson
e spearman
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)
Resultado:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.5
Obtained Marks -0.5 1.0
Agora a função calculou a correlação utilizando 2 pares de valores de colunas.