Pandas의 GroupBy 월

Preet Sanghavi 2023년6월21일
  1. Pandas에서 월별로 데이터 프레임 그룹화
  2. Pandas에서 groupby() 기능 사용
Pandas의 GroupBy 월

이 튜토리얼은 Pandas를 사용하여 날짜, 특히 월별로 데이터 프레임을 정렬합니다. 필요한 라이브러리를 가져오는 것으로 시작하겠습니다.

Pandas에서 월별로 데이터 프레임 그룹화

관련 라이브러리 가져오기:

import pandas as pd

월 순서대로 정렬하려면 날짜가 포함된 데이터 프레임을 만들어야 합니다. 우리의 경우 작업하는 데 세 가지 날짜가 걸립니다.

아래 코드를 사용하여 샘플 데이터 프레임을 생성합니다.

df = pd.DataFrame(
    {
        "Date": [
            pd.Timestamp("2000-11-02"),
            pd.Timestamp("2000-01-02"),
            pd.Timestamp("2000-01-09"),
        ],
        "ID": [1, 2, 3],
        "Price": [140, 120, 230],
    }
)

날짜가 포함된 샘플 데이터 프레임을 살펴보겠습니다.

print(df)
        Date  ID  Price
0 2000-11-02   1    140
1 2000-01-02   2    120
2 2000-01-09   3    230

데이터 프레임을 만든 후 월순으로 정렬해 보겠습니다. groupby() 함수를 사용하여 전체 데이터 프레임에서 작업합니다.

Pandas에서 groupby() 기능 사용

Pandas GroupBy를 사용하여 개체에 groupby 지시문을 지정할 수 있습니다. 이 명령은 grouper 기능의 key 인수, 제공된 경우 레벨 및/또는 axis 매개변수, 대상 개체 또는 열의 인덱스 수준을 사용하여 열을 선택합니다.

아래 코드를 사용하여 샘플 데이터 프레임에서 groupby 작업을 수행해 보겠습니다.

df1 = df.groupby(pd.Grouper(key="Date", axis=0, freq="M")).sum()

이제 데이터 프레임을 그룹화했으므로 업데이트된 데이터 프레임을 살펴보겠습니다.

print(df1)
            ID  Price
Date
2000-01-31   5    350
2000-02-29   0      0
2000-03-31   0      0
2000-04-30   0      0
2000-05-31   0      0
2000-06-30   0      0
2000-07-31   0      0
2000-08-31   0      0
2000-09-30   0      0
2000-10-31   0      0
2000-11-30   1    140

Date 열은 위의 예에서 데이터 프레임을 그룹화합니다. 월을 나타내는 freq = 'M'을 지정했기 때문에 데이터는 매월 마지막 날짜까지 월별로 그룹화되고 price 열의 합계가 표시됩니다.

모든 달에 대한 값을 제공하지 않았기 때문에 groupby 메소드는 다른 달에 0 값을 할당하면서 모든 달에 대한 데이터를 표시했습니다.

따라서 위의 접근 방식을 사용하여 Pandas에서 월별로 데이터 프레임을 성공적으로 그룹화했습니다.

Preet Sanghavi avatar Preet Sanghavi avatar

Preet writes his thoughts about programming in a simplified manner to help others learn better. With thorough research, his articles offer descriptive and easy to understand solutions.

LinkedIn GitHub

관련 문장 - Pandas GroupBy