Pandas에서 분위수 찾기
Preet Sanghavi
2023년6월21일
이 튜토리얼에서는 Pandas에서 데이터 프레임의 분위수를 얻는 방법을 배웁니다. 이 작업을 수행하기 위해 dataframe.quantile()
함수를 사용할 것입니다.
Pandas의 numpy.percentile
및 dataframe.quantile()
함수는 요청된 축에 대해 제공된 Quantile에서 값을 반환합니다.
시작하려면 Pandas 라이브러리를 가져와야 합니다.
import pandas as pd
Pandas에서 분위수 찾기
이제 분위수 연산을 수행하려는 숫자가 포함된 4개의 열이 있는 샘플 데이터 프레임을 만들어 보겠습니다.
아래 코드를 사용하여 샘플 데이터 프레임을 만듭니다.
df = pd.DataFrame(
{
"A": [1, 5, 3, 4, 2],
"B": [3, 2, 4, 3, 4],
"C": [2, 2, 7, 3, 4],
"D": [4, 3, 6, 12, 7],
}
)
print(df)
샘플 데이터 프레임을 살펴보겠습니다.
A B C D
0 1 3 2 4
1 5 2 2 3
2 3 4 7 6
3 4 3 3 12
4 2 4 4 7
이제 데이터 프레임의 분위수를 찾을 것입니다. 먼저 dataframe.quantile()
함수를 사용하여 데이터 프레임의 모든 열에 대한 .2
의 분위수를 찾습니다.
quantile()
함수 사용
함수의 첫 번째 매개변수를 .2
로 전달하고 축 매개변수를 0
으로 전달하여 Quantile이 열에서 계산되도록 아래 코드를 사용하여 이를 수행합니다.
df1 = df.quantile(0.2, axis=0)
print(df1)
이제 우리가 얻은 데이터 프레임의 Quantile 표현을 살펴보겠습니다.
A 1.8
B 2.8
C 2.0
D 3.8
quantile()
함수를 사용하여 인덱스 축을 따라 (.1,.25,.5,.75)
분위수를 찾을 수도 있습니다.
이를 위해 분위수를 얻으려는 분위수 값 목록을 전달합니다.
df1 = df.quantile([0.1, 0.25, 0.5, 0.75], axis=0)
print(df1)
이제 새로 얻은 분위수 표현을 살펴보겠습니다.
A B C D
0.10 1.4 2.4 2.0 3.4
0.25 2.0 3.0 2.0 4.0
0.50 3.0 3.0 3.0 6.0
0.75 4.0 4.0 4.0 7.0
언급된 분위수 값에 대한 인덱스 축을 따라 분위수 값을 성공적으로 얻었습니다.
따라서 다음 접근 방식을 사용하여 Pandas에서 열과 인덱스 축에 대한 분위수를 찾을 수 있습니다.
작가: Preet Sanghavi