Pandas Series Series.value_counts() 함수
-
pandas.Series.value_counts()
의 구문 : -
예제 코드:
Series.value_counts()
메서드를 사용하여 Pandas 시리즈에서 고유 요소의 발생 횟수 계산 -
예제 코드: 요소의 상대 주파수를 얻기 위해
Series.value_counts()
메서드에서normalize = True
를 설정합니다 -
예제 코드:
Series.value_counts()
메서드에서ascending = True
를 설정하여 빈도 값을 기준으로 오름차순으로 요소를 정렬합니다 -
예제 코드:
Series.value_counts()
메서드에서bins
매개 변수를 설정하여 반 개방 빈에있는 값의 개수를 얻습니다 -
예제 코드:
Series.value_counts()
메서드의dropna = False
를NaN
개수로 설정
pandas.Series.value_counts()
방법은 Series
에서 각 고유 요소의 발생 횟수를 계산한다.
pandas.Series.value_counts()
의 구문 :
Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
매개 변수
normalize |
부울. 고유 값의 상대 빈도 (normalize = True ) 또는 고유 값의 절대 빈도 (normalize = False )입니다. |
sort |
부울. 빈도 (sort = True )를 기준으로 요소를 정렬하거나 Series 객체를 정렬되지 않은 상태로 둡니다 (sort = False ). |
ascending |
부울. 오름차순 (ascending = True ) 또는 내림차순 (ascending = False )으로 값 정렬 |
bins |
정수. Series 객체의 값 범위가 분할 된 파티션 수 |
dropna |
부울. NaN (dropna = False ) 개수를 포함하거나NaN (dropna = True ) 개수를 제외합니다. |
반환
고유 한 값의 개수로 구성된 Series 객체를 반환합니다.
예제 코드: Series.value_counts()
메서드를 사용하여 Pandas 시리즈에서 고유 요소의 발생 횟수 계산
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)
absolute_counts=df["X"].value_counts()
print("Frequencies of elements of X column:")
print(absolute_counts)
출력:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
Frequencies of elements of X column:
3.0 2
2.0 1
1.0 1
Name: X, dtype: int64
absolute_counts
는Series.value_counts()
메소드를 사용하여X
열의 각 고유 요소의 개수를 제공합니다.
Series.value_counts()
는 기본적으로NaN
을 계산하지 않습니다. 다음 섹션에서 계산하는 방법을 소개합니다.
예제 코드: 요소의 상대 주파수를 얻기 위해Series.value_counts()
메서드에서normalize = True
를 설정합니다
Series.value_counts()
메서드에서normalize = True
를 설정하면Series
객체에있는 모든 고유 요소의 상대 빈도를 얻습니다.
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)
relative_counts=df["X"].value_counts(normalize=True)
print("Relative Frequencies of elements of X column:")
print(relative_counts)
출력:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
Frequencies of elements of X column:
3.0 0.50
2.0 0.25
1.0 0.25
Name: X, dtype: float64
relative_counts
Series 객체는X
열의 고유 한 각 요소의 상대 빈도를 제공합니다.
상대 주파수는 모든 절대 주파수를 절대 주파수의 합으로 나눈 값입니다.
예제 코드: Series.value_counts()
메서드에서ascending = True
를 설정하여 빈도 값을 기준으로 오름차순으로 요소를 정렬합니다
Series.value_counts()
메서드에서ascending = True
를 설정하면 빈도 값을 기준으로 오름차순으로 정렬 된 요소가있는Series
객체를 얻습니다.
기본적으로Series.value_counts()
메서드에서 반환 된 Series 객체의 값은 빈도 값을 기준으로 내림차순으로 정렬됩니다.
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)
sorted_counts=df["X"].value_counts(ascending=True)
print("Frequencies of elements of X column:")
print(sorted_counts)
출력:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
Frequencies of elements of X column:
1.0 1
2.0 1
3.0 2
Name: X, dtype: int64
오름차순으로 정렬 된 빈도 값과 함께X
열에있는 각 고유 개체의 개수를 제공합니다.
예제 코드: Series.value_counts()
메서드에서bins
매개 변수를 설정하여 반 개방 빈에있는 값의 개수를 얻습니다
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3, 4, 5],
'Y': [4, np.nan, 8, np.nan, 3, 2, 1]})
print("DataFrame:")
print(df)
counts=df["X"].value_counts(bins=3)
print("Frequencies:")
print(counts)
출력:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
5 4.0 2.0
6 5.0 1.0
Frequencies:
(3.667, 5.0] 2
(2.333, 3.667] 2
(0.995, 2.333] 2
Name: X, dtype: int64
Series
, 즉 X
열의 값 범위를 세 부분으로 나누고 각 반 개방 빈에있는 값의 개수를 반환합니다.
예제 코드: Series.value_counts()
메서드의dropna = False
를NaN
개수로 설정
Series.value_counts()
메소드에서dropna = False
를 설정하면NaN
값의 개수도 얻습니다.
import pandas as pd
import numpy as np
df = pd.DataFrame({'X': [1, 2, 3, np.nan, 3],
'Y': [4, np.nan, 8, np.nan, 3]})
print("DataFrame:")
print(df)
counts=df["Y"].value_counts(dropna=False)
print("Frequencies:")
print(counts)
출력:
DataFrame:
X Y
0 1.0 4.0
1 2.0 NaN
2 3.0 8.0
3 NaN NaN
4 3.0 3.0
Frequencies:
NaN 2
3.0 1
8.0 1
4.0 1
Name: Y, dtype: int64
NaN
값의 개수와 함께 DataFrame
의Y
열에있는 각 요소의 개수를 제공합니다.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn