Pandas DataFrame.corr() 함수

Minahil Noor 2023년1월30일
  1. pandas.DataFrame.corr()의 구문 :
  2. 예제 코드: Pearson 메서드를 사용하여 상관 행렬을 찾는DataFrame.corr()메서드
  3. 예제 코드:kendall 메서드를 사용하여 상관 행렬을 찾는DataFrame.corr()메서드
  4. 예제 코드: 더 많은 열 값 쌍이있는spearman 메서드를 사용하여 상관 행렬을 찾는DataFrame.corr()메서드
Pandas DataFrame.corr() 함수

Python Pandas DataFrame.corr() 함수는 데이터 프레임의 열 사이의 상관 관계를 찾습니다.

pandas.DataFrame.corr()의 구문 :

DataFrame.corr(method="pearson", min_periods=1)

매개 변수

method 상관의 방법입니다. pearson, kendallspearman이 될 수 있습니다. pearson이 기본값입니다.
min_periods 이 매개 변수는 유효한 결과를 얻기 위해 열 쌍당 필요한 최소 관측치 수를 지정합니다. 현재 pearsonspearman상관 관계에서만 사용할 수 있습니다.

반환

열간에 계산 된 상관 관계가있는 Dataframe을 반환합니다.

예제 코드: Pearson 메서드를 사용하여 상관 행렬을 찾는DataFrame.corr()메서드

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)

출력:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance         1.00000        -0.61515
Obtained Marks    -0.61515         1.00000

함수가 상관 행렬을 반환했습니다. 숫자가 아닌 열을 무시했습니다. Pearson방법과 한 쌍의 열 값 (min_position = 1)을 사용하여 상관 관계를 계산했습니다.

예제 코드:kendall 메서드를 사용하여 상관 행렬을 찾는DataFrame.corr()메서드

Kendall 메서드를 사용하여 상관 관계를 찾기 위해method = "kendall"을 사용하는corr()함수를 호출합니다.

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)

출력:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.4
Obtained Marks        -0.4             1.0

함수가 상관 행렬을 반환했습니다. Kendall 방법과 한 쌍의 열 값 (min_position = 1)을 사용하여 상관 관계를 계산했습니다.

예제 코드: 더 많은 열 값 쌍이있는spearman 메서드를 사용하여 상관 행렬을 찾는DataFrame.corr()메서드

이제spearman 메소드를 사용하여min_periods 값을2로 설정합니다. min_periods매개 변수는 pearsonspearman메소드에만 사용할 수 있습니다.

import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                        'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                        'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)

dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)

출력:

The Original Data frame is: 

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45
The Correlation Matrix is: 

                Attendance  Obtained Marks
Attendance             1.0            -0.5
Obtained Marks        -0.5             1.0

이제 함수는 두 쌍의 열 값을 사용하여 상관 관계를 계산했습니다.

관련 문장 - Pandas DataFrame