Pandas Groupby Describe
Pandas es una de las bibliotecas más útiles y utilizadas para el análisis de datos; sin embargo, no es fácil analizar los datos, pero afortunadamente Pandas nos ha brindado muchas funciones útiles. Y una de las funciones útiles es la función groupby.describe()
.
El describe()
se utiliza para resumir rápidamente los datos y proporcionar un análisis estadístico para cualquier variable o grupo. El describe()
se puede aplicar a todo el conjunto de datos, columnas individuales o un grupo de columnas.
La sintaxis de groupby.describe()
se encuentra a continuación.
df.groupby("var_a")["var_b"].describe()
Usa Pandas groupby().describe()
en Python
Las funciones groupby()
ayudan a agrupar el conjunto de datos en subgrupos en función de diferentes variables. Podemos agrupar el conjunto de datos en base a una o más de una variable, mientras que las funciones describe()
nos brindan un análisis estadístico de los grupos.
Pero antes de entrar en los detalles del grupo y analizar los datos, primero, creemos un marco de datos.
# import pandas
import pandas as pd
# create DataFrame
df = pd.DataFrame(
{
"teams": ["A", "B", "C", "D", "E", "F"],
"points": [8, 12, 14, 14, 15, 22],
"assists": [2, 9, 3, 5, 7, 6],
}
)
# view DataFrame
print(df)
Producción :
teams points assists
0 A 8 2
1 B 12 9
2 C 14 3
3 D 14 5
4 E 15 7
5 F 22 6
Hasta ahora, hemos creado un marco de datos; a continuación, agrupemos los datos usando la función groupby()
y veamos el análisis estadístico usando describe()
.
# import pandas
import pandas as pd
# create DataFrame
df = pd.DataFrame(
{
"teams": ["A", "B", "C", "D", "E", "F"],
"points": [8, 12, 14, 14, 15, 22],
"assists": [2, 9, 3, 5, 7, 6],
}
)
# create a group
group = df.groupby("points")
print(group.first())
print("\n\n********** Group stats **********")
# see the stats using
group_stats = df.groupby("points").describe()
print(group_stats)
Producción :
team assists
points
8 A 2
12 B 9
14 C 3
15 E 7
22 F 6
********** Group stats **********
assists
count mean std min 25% 50% 75% max
points
8 1.0 2.0 NaN 2.0 2.0 2.0 2.0 2.0
12 1.0 9.0 NaN 9.0 9.0 9.0 9.0 9.0
14 2.0 4.0 1.414214 3.0 3.5 4.0 4.5 5.0
15 1.0 7.0 NaN 7.0 7.0 7.0 7.0 7.0
22 1.0 6.0 NaN 6.0 6.0 6.0 6.0 6.0
Como puede ver en el ejemplo anterior, estamos agrupando los datos en función de puntos
y luego aplicando describe()
de la siguiente manera group_stats = df.groupby('points').describe()
. Ahora, como puede ver, estamos viendo las estadísticas como min
, max
, std
, etc.
Conclusión
Para resumir el artículo sobre cómo agrupar datos y ver las estadísticas usando la función groupby.describe()
, hemos discutido qué son las funciones groupby()
y describe()
y cómo funcionan. Además, hemos discutido las diferentes funciones estadísticas utilizadas por la función describe()
para analizar los datos en Python.
Zeeshan is a detail oriented software engineer that helps companies and individuals make their lives and easier with software solutions.
LinkedIn