Funzione Pandas DataFrame DataFrame.aggregate()

Minahil Noor 30 gennaio 2023
  1. Sintassi di pandas.DataFrame.aggregate()
  2. Codici di esempio: Pandas DataFrame.aggregate()
  3. Codici di esempio: DataFrame.aggregate() con le funzioni multiple
  4. Codici di esempio: DataFrame.aggregate() con una colonna specificata
Funzione Pandas DataFrame DataFrame.aggregate()

La funzione pandas.DataFrame.aggregate() aggrega le colonne o le righe di un DataFrame. Le funzioni di aggregazione più comunemente utilizzate sono min, max e sum. Queste funzioni di aggregazione determinano la riduzione delle dimensioni del DataFrame.

Sintassi di pandas.DataFrame.aggregate()

DataFrame.aggregate(func, axis, *args, **kwargs)

Parametri

func È la funzione di aggregazione da applicare. Può essere un callable o una lista di callable, una stringa o una lista di stringhe o un dizionario.
axis 0 per impostazione predefinita. Se è 0 o 'index', la funzione viene applicata alle singole colonne. Se è 1 o 'columns', la funzione viene applicata alle singole righe
*args È un argomento posizionale.
**kwargs È un argomento di parole chiave.

Ritorno

Questa funzione restituisce uno scalare, una serie o un DataFrame.

  • Restituisce uno scalare se una singola funzione viene chiamata con Series.agg().
  • Restituisce una Series se una singola funzione viene chiamata con DataFrame.agg().
  • Restituisce un DataFrame se più funzioni vengono chiamate con DataFrame.agg().

Codici di esempio: Pandas DataFrame.aggregate()

DataFrame.agg() è un alias per DataFrame.aggregate(). È meglio usare l’alias. Quindi useremo DataFrame.agg() nei codici di esempio.

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                    'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                    'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print(dataframe)

L’esempio DataFrame è di seguito.

   Attendance    Name Obtained Marks
0          60  Olivia            90
1         100    John            75
2          80   Laura            82
3          78     Ben            64
4          95   Kevin            45

Per prima cosa controlleremo la funzione DataFrame.agg() utilizzando solo una singola funzione di aggregazione.

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

dataframe1 = dataframe.agg("sum")
print(dataframe1)

Produzione:

Attendance                            413
Name              OliviaJohnLauraBenKevin
Obtained Marks                        356
dtype: object

La funzione aggregata sum viene applicata alle singole colonne.

Per la colonna di tipo intero, ha generato la somma; e per la colonna di tipo stringa, ha concatenato le stringhe. dtype: object mostra che viene restituita una Series.

Codici di esempio: DataFrame.aggregate() con le funzioni multiple

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

dataframe1 = dataframe.agg(["sum", "min"])
print(dataframe1)

Produzione:

     Attendance                     Name  Obtained Marks
sum         413  OliviaJohnLauraBenKevin             356
min          60                      Ben              45

Le funzioni di aggregazione sum e min vengono applicate alle singole colonne.

Per la colonna di tipo intero, la funzione min ha generato il valore minimo, e per la colonna di tipo stringa, ha mostrato la stringa di lunghezza minima.

Codici di esempio: DataFrame.aggregate() con una colonna specificata

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

dataframe1 = dataframe.agg({"Obtained Marks": "sum"})
print(dataframe1)

Produzione:

Obtained Marks    356
dtype: int64

Viene restituita la somma di una singola colonna. dtype: int64 mostra che questa funzione ha restituito una Series.

Potremmo anche applicare più funzioni su una singola colonna.

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)
dataframe1 = dataframe.agg({"Obtained Marks": ["sum", "max"]})
print(dataframe1)

Produzione:

     Obtained Marks
sum             356
max              90

Articolo correlato - Pandas DataFrame