Pandas Contar Valores Únicos
-
Contar valores únicos en un DataFrame usando
Series.value_counts()
-
Contar valores únicos en un DataFrame usando
DataFrame.nunique()
Este tutorial explica cómo podemos obtener el recuento de todos los valores únicos en un DataFrame utilizando los métodos Series.value_counts()
y DataFrame.nunique()
.
import pandas as pd
patients_df = pd.DataFrame(
{
"Name": ["Jennifer", "Travis", "Bob", "Emma", "Luna", "Anish"],
"Date": [
"2020-12-01",
"2020-12-01",
"2020-12-02",
"2020-12-02",
"2020-12-02",
"2020-12-03",
],
"Age": [17, 18, 17, 16, 18, 16],
}
)
print(patients_df)
Producción :
Name Date Age
0 Jennifer 2020-12-01 17
1 Travis 2020-12-01 18
2 Bob 2020-12-02 17
3 Emma 2020-12-02 16
4 Luna 2020-12-02 18
5 Anish 2020-12-03 16
Utilizaremos el DataFrame patients_df
, que contiene los nombres de los pacientes, la fecha de su cita y la edad, para explicar cómo podemos obtener el recuento de todos los valores únicos en un DataFrame.
Contar valores únicos en un DataFrame usando Series.value_counts()
import pandas as pd
patients_df = pd.DataFrame(
{
"Name": ["Jennifer", "Travis", "Bob", "Emma", "Luna", "Anish"],
"Date": [
"2020-12-01",
"2020-12-01",
"2020-12-02",
"2020-12-02",
"2020-12-02",
"2020-12-03",
],
"Age": [17, 18, 17, 16, 18, 16],
}
)
print("The DataFrame is:")
print(patients_df, "\n")
print("No of appointments for each date:")
print(patients_df["Date"].value_counts())
Producción :
The DataFrame is:
Name Date Age
0 Jennifer 2020-12-01 17
1 Travis 2020-12-01 18
2 Bob 2020-12-02 17
3 Emma 2020-12-02 16
4 Luna 2020-12-02 18
5 Anish 2020-12-03 16
No of appointments for each date:
2020-12-02 3
2020-12-01 2
2020-12-03 1
Name: Date, dtype: int64
Muestra el recuento de cada valor único de la columna Date
en el DataFrame.
Contar valores únicos en un DataFrame usando DataFrame.nunique()
import pandas as pd
patients_df = pd.DataFrame(
{
"Name": ["Jennifer", "Travis", "Bob", "Emma", "Luna", "Anish"],
"Date": [
"2020-12-01",
"2020-12-01",
"2020-12-02",
"2020-12-02",
"2020-12-02",
"2020-12-03",
],
"Age": [17, 18, 17, 16, 18, 16],
}
)
print(patients_df, "\n")
print(patients_df.groupby("Date").Name.nunique())
Producción :
Name Date Age
0 Jennifer 2020-12-01 17
1 Travis 2020-12-01 18
2 Bob 2020-12-02 17
3 Emma 2020-12-02 16
4 Luna 2020-12-02 18
5 Anish 2020-12-03 16
Date
2020-12-01 2
2020-12-02 3
2020-12-03 1
Name: Name, dtype: int64
Divide el DataFrame basado en el valor de la columna Date
, es decir, las filas con el mismo valor de Date
se colocan en el mismo grupo y luego cuenta la ocurrencia de cada nombre en un grupo particular para conocer el conteo de cada valor único de la columna Date
en el DataFrame.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn