Pandas DataFrame.corr() Função

Minahil Noor 30 janeiro 2023
  1. Sintaxe de pandas.DataFrame.corr():
  2. Códigos de exemplo: DataFrame.corr() Método para encontrar a matriz de correlação utilizando o método Pearson
  3. Códigos de exemplo: DataFrame.corr() Método para encontrar a Matriz de Correlação utilizando o método kendall
  4. Códigos de exemplo: DataFrame.corr() Método para encontrar a matriz de correlação utilizando o método spearman com mais pares de valores de colunas
Pandas DataFrame.corr() Função

Python Pandas DataFrame.corr() função encontra a correlação entre as colunas da moldura de dados.

Sintaxe de pandas.DataFrame.corr():

DataFrame.corr(method="pearson", min_periods=1)

Parâmetros

method É o método de correlação. Pode ser pearson, kendall e spearman. O pearson é o padrão.
min_periods Este parâmetro especifica o número mínimo de observações necessárias por par de colunas para ter um resultado válido. Actualmente só está disponível para as correlações pearson' e spearman'.

Devolver

Retorna o Dataframe com a correlação computorizada entre colunas.

Códigos de exemplo: DataFrame.corr() Método para encontrar a matriz de correlação utilizando o método Pearson

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)

Resultado:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance         1.00000        -0.61515
Obtained Marks    -0.61515         1.00000

A função devolveu a matriz de correlação. Ignorou a coluna não-numérica. Calculou a correlação utilizando o método Pearson e um par de valores de colunas (min_position= 1).

Códigos de exemplo: DataFrame.corr() Método para encontrar a Matriz de Correlação utilizando o método kendall

Para encontrar a correlação utilizando o método Kendall, chamaremos a função corr() para utilizar method= "kendall".

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)

Resultado:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.4
Obtained Marks        -0.4             1.0

A função devolveu a matriz de correlação. Ela calculou a correlação utilizando o método de Kendall e um par de valores de colunas (min_position= 1).

Códigos de exemplo: DataFrame.corr() Método para encontrar a matriz de correlação utilizando o método spearman com mais pares de valores de colunas

Agora vamos definir o valor de min_periods a 2 utilizando o método spearman. O parâmetro min_periods só está disponível para os métodos pearson e spearman.

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)

Resultado:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.5
Obtained Marks        -0.5             1.0

Agora a função calculou a correlação utilizando 2 pares de valores de colunas.

Artigo relacionado - Pandas DataFrame