Calcular la media de datos agrupados en Pandas
-
Use
groupby.mean()
para calcular la media de una sola columna en Pandas -
Utilice
groupby.mean()
para calcular la media de varias columnas en Pandas -
Utilice el método
agg()
para calcular la media de datos agrupados en Pandas
Pandas es una biblioteca de análisis de datos de código abierto en Python. Proporciona muchos métodos integrados para realizar operaciones en datos numéricos.
groupby()
es uno de los métodos disponibles en Pandas que divide los datos en múltiples grupos de acuerdo con algunos criterios. Después de eso, podemos aplicar diferentes métodos a los datos agrupados como count()
, mean()
, etc.
Este tutorial demostrará cómo encontrar la media de datos agrupados usando el método groupby.mean()
en Pandas.
Use groupby.mean()
para calcular la media de una sola columna en Pandas
Aquí, tenemos los datos de los estudiantes en el objeto de marco de datos de Pandas con datos agrupados según el departamento. Tendremos dos grupos para dos departamentos.
Luego calcularemos las notas promedio de los estudiantes de cada grupo o departamento a través del método groupby.mean()
en una sola columna, es decir, Notas
. En la salida, obtendremos las calificaciones promedio de los estudiantes de los departamentos de CS y SE.
Código de ejemplo:
# Python 3.x
import pandas as pd
df = pd.DataFrame(
{
"Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
"Department": ["CS", "SE", "SE", "SE", "CS"],
"Marks": [60, 81, 79, 51, 88],
"Age": [20, 21, 20, 22, 23],
}
)
display(df)
df.groupby("Department")["Marks"].mean()
Producción:
Utilice groupby.mean()
para calcular la media de varias columnas en Pandas
También podemos tomar la media de varias columnas simultáneamente después de agrupar los datos proporcionando los nombres de todos los problemas para los que queremos calcular la media. En el siguiente código, dividimos los datos según el departamento y luego calculamos las Marcas
y la Edad
promedio de los estudiantes.
Código de ejemplo:
# Python 3.x
import pandas as pd
df = pd.DataFrame(
{
"Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
"Department": ["CS", "SE", "SE", "SE", "CS"],
"Marks": [60, 81, 79, 51, 88],
"Age": [20, 21, 20, 22, 23],
}
)
display(df)
df.groupby("Department")["Marks", "Age"].mean()
Producción:
Utilice el método agg()
para calcular la media de datos agrupados en Pandas
Alternativamente, también podemos usar el método agg()
para calcular la media de un grupo por el objeto. Pasaremos mean
como argumento al método agg()
.
Código de ejemplo:
# Python 3.x
import pandas as pd
df = pd.DataFrame(
{
"Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
"Department": ["CS", "SE", "SE", "SE", "CS"],
"Marks": [60, 81, 79, 51, 88],
"Age": [20, 21, 20, 22, 23],
}
)
display(df)
df.groupby("Department")["Marks"].agg("mean")
Producción:
I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.
LinkedIn