Calcular la media de datos agrupados en Pandas

Fariba Laiq 15 febrero 2024
  1. Use groupby.mean() para calcular la media de una sola columna en Pandas
  2. Utilice groupby.mean() para calcular la media de varias columnas en Pandas
  3. Utilice el método agg() para calcular la media de datos agrupados en Pandas
Calcular la media de datos agrupados en Pandas

Pandas es una biblioteca de análisis de datos de código abierto en Python. Proporciona muchos métodos integrados para realizar operaciones en datos numéricos.

groupby() es uno de los métodos disponibles en Pandas que divide los datos en múltiples grupos de acuerdo con algunos criterios. Después de eso, podemos aplicar diferentes métodos a los datos agrupados como count(), mean(), etc.

Este tutorial demostrará cómo encontrar la media de datos agrupados usando el método groupby.mean() en Pandas.

Use groupby.mean() para calcular la media de una sola columna en Pandas

Aquí, tenemos los datos de los estudiantes en el objeto de marco de datos de Pandas con datos agrupados según el departamento. Tendremos dos grupos para dos departamentos.

Luego calcularemos las notas promedio de los estudiantes de cada grupo o departamento a través del método groupby.mean() en una sola columna, es decir, Notas. En la salida, obtendremos las calificaciones promedio de los estudiantes de los departamentos de CS y SE.

Código de ejemplo:

# Python 3.x
import pandas as pd

df = pd.DataFrame(
    {
        "Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
        "Department": ["CS", "SE", "SE", "SE", "CS"],
        "Marks": [60, 81, 79, 51, 88],
        "Age": [20, 21, 20, 22, 23],
    }
)
display(df)
df.groupby("Department")["Marks"].mean()

Producción:

Media de una sola columna de Pandas - Salida

Utilice groupby.mean() para calcular la media de varias columnas en Pandas

También podemos tomar la media de varias columnas simultáneamente después de agrupar los datos proporcionando los nombres de todos los problemas para los que queremos calcular la media. En el siguiente código, dividimos los datos según el departamento y luego calculamos las Marcas y la Edad promedio de los estudiantes.

Código de ejemplo:

# Python 3.x
import pandas as pd

df = pd.DataFrame(
    {
        "Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
        "Department": ["CS", "SE", "SE", "SE", "CS"],
        "Marks": [60, 81, 79, 51, 88],
        "Age": [20, 21, 20, 22, 23],
    }
)
display(df)
df.groupby("Department")["Marks", "Age"].mean()

Producción:

Media de columnas múltiples de Pandas - Salida

Utilice el método agg() para calcular la media de datos agrupados en Pandas

Alternativamente, también podemos usar el método agg() para calcular la media de un grupo por el objeto. Pasaremos mean como argumento al método agg().

Código de ejemplo:

# Python 3.x
import pandas as pd

df = pd.DataFrame(
    {
        "Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
        "Department": ["CS", "SE", "SE", "SE", "CS"],
        "Marks": [60, 81, 79, 51, 88],
        "Age": [20, 21, 20, 22, 23],
    }
)
display(df)
df.groupby("Department")["Marks"].agg("mean")

Producción:

Media de datos agrupados de Pandas usando agg () - Salida

Fariba Laiq avatar Fariba Laiq avatar

I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.

LinkedIn

Artículo relacionado - Pandas Statistics

Artículo relacionado - Pandas GroupBy