Pandas축 의미
Suraj Joshi
2021년2월9일
이 튜토리얼에서는 DataFrames 및Series
와 같은 Pandas 객체의 다양한 메서드에서 사용되는axis
매개 변수의 의미를 설명합니다.
import pandas as pd
empl_df = pd.DataFrame(
{
"Name": ["Jon", "Willy", "Mike", "Luna", "Sam", "Aliza"],
"Age": [30, 33, 35, 30, 30, 31],
"Weight(KG)": [75, 75, 80, 70, 73, 70],
"Height(meters)": [1.7, 1.7, 1.85, 1.75, 1.8, 1.75],
"Salary($)": [3300, 3500, 4000, 3050, 3500, 3700],
}
)
print(empl_df)
출력:
Name Age Weight(KG) Height(meters) Salary($)
0 Jon 30 75 1.70 3300
1 Willy 33 75 1.70 3500
2 Mike 35 80 1.85 4000
3 Luna 30 70 1.75 3050
4 Sam 30 73 1.80 3500
5 Aliza 31 70 1.75 3700
Pandas 메서드에서axis
매개 변수를 사용하는 방법을 설명하기 위해 DataFrame empl_df
를 사용합니다.
Pandas 메서드에서axis
매개 변수 사용
axis
매개 변수는 특정 메소드 또는 함수가 DataFrame에 적용되는 방향을 지정합니다. axis = 0
은 함수가 열 단위로 적용되었음을 나타내고, axis = 1
은 함수가 DataFrame에서 행 단위로 적용됨을 의미합니다.
열 방식으로 함수를 적용하면 단일 행으로 결과를 얻을 수 있습니다. 행 방식으로 함수를 적용하면 단일 열이있는 DataFrame이 생성됩니다.
예 : Pandas 메서드에서axis = 0
사용
import pandas as pd
empl_df = pd.DataFrame(
{
"Name": ["Jon", "Willy", "Mike", "Luna", "Sam", "Aliza"],
"Age": [30, 33, 35, 30, 30, 31],
"Weight(KG)": [75, 75, 80, 70, 73, 70],
"Height(meters)": [1.7, 1.7, 1.85, 1.75, 1.8, 1.75],
"Salary($)": [3300, 3500, 4000, 3050, 3500, 3700],
}
)
print("The Employee DataFrame is:")
print(empl_df, "\n")
print("The DataFrame with mean values of each column is:")
print(empl_df.mean(axis=0))
출력:
The Employee DataFrame is:
Name Age Weight(KG) Height(meters) Salary($)
0 Jon 30 75 1.70 3300
1 Willy 33 75 1.70 3500
2 Mike 35 80 1.85 4000
3 Luna 30 70 1.75 3050
4 Sam 30 73 1.80 3500
5 Aliza 31 70 1.75 3700
The DataFrame with mean values of each column is:
Age 31.500000
Weight(KG) 73.833333
Height(meters) 1.758333
Salary($) 3508.333333
dtype: float64
DataFrame empl_df
의 열 단위 평균을 계산합니다. 평균은 숫자 값이있는 열에 대해서만 계산됩니다.
axis = 0
을 설정하면 해당 특정 열의 행 값을 평균하여 각 열의 평균을 계산합니다.
예 : Pandas 메서드에서axis = 1
사용
import pandas as pd
empl_df = pd.DataFrame(
{
"Name": ["Jon", "Willy", "Mike", "Luna", "Sam", "Aliza"],
"Age": [30, 33, 35, 30, 30, 31],
"Weight(KG)": [75, 75, 80, 70, 73, 70],
"Height(meters)": [1.7, 1.7, 1.85, 1.75, 1.8, 1.75],
"Salary($)": [3300, 3500, 4000, 3050, 3500, 3700],
}
)
print("The Employee DataFrame is:")
print(empl_df, "\n")
print("The DataFrame with mean values of each row is:")
print(empl_df.mean(axis=1))
출력:
The Employee DataFrame is:
Name Age Weight(KG) Height(meters) Salary($)
0 Jon 30 75 1.70 3300
1 Willy 33 75 1.70 3500
2 Mike 35 80 1.85 4000
3 Luna 30 70 1.75 3050
4 Sam 30 73 1.80 3500
5 Aliza 31 70 1.75 3700
The DataFrame with mean values of each row is:
0 851.6750
1 902.4250
2 1029.2125
3 787.9375
4 901.2000
5 950.6875
dtype: float64
DataFrame empl_df
에 대한 행 단위 평균을 계산합니다. 즉, 해당 행에 대한 숫자 유형의 열 값을 평균화하여 각 행의 평균 값을 계산합니다. 마지막에 각 행의 평균 값이있는 단일 열을 얻습니다.
작가: Suraj Joshi
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn관련 문장 - Pandas DataFrame Row
- Pandas DataFrame의 행 수를 얻는 방법
- Pandas에서 DataFrame 행을 무작위로 섞는 방법
- Pandas의 열 값을 기반으로 데이터 프레임 행을 필터링하는 방법
- Pandas에서 DataFrame의 행을 반복하는 방법
- Pandas에서 특정 열이 주어진 조건을 만족하는 모든 행의 색인을 얻는 방법
- Pandas를 사용하여 DataFrame에서 중복 행 찾기