Pandas DataFrame DataFrame.aggregate() Funktion

Minahil Noor 30 Januar 2023
  1. Syntax von pandas.DataFrame.aggregate()
  2. Beispiel-Codes: Pandas DataFrame.agg()
  3. Beispielcodes: DataFrame.aggregate() Mit den Mehrfachfunktionen
  4. Beispielcodes: DataFrame.aggregate() mit einer spezifizierten Spalte
Pandas DataFrame DataFrame.aggregate() Funktion

Die Funktion pandas.DataFrame.aggregate() aggregiert die Spalten oder Zeilen eines DataFrame. Die am häufigsten verwendeten Aggregationsfunktionen sind min, max und sum. Diese Aggregationsfunktionen führen zu einer Verringerung der Größe des DataFrame.

Syntax von pandas.DataFrame.aggregate()

DataFrame.aggregate(func, axis, *args, **kwargs)

Parameter

func Es ist die anzuwendende Aggregationsfunktion. Sie kann eine callable oder eine Liste von callable, eine Zeichenkette oder eine Liste von Zeichenketten oder ein Dictionary sein.
axis 0 standardmäßig. Ist sie 0 oder 'index', dann wird die Funktion auf die einzelnen Spalten angewendet. Wenn es 1 oder 'columns' ist, wird die Funktion auf die einzelnen Zeilen angewendet.
*args Es ist ein Positionsargument.
**kwargs Es ist ein Stichwortargument.

Zurück

Diese Funktion gibt einen scalar, eine Series oder einen DataFrame zurück.

  • Sie gibt einen scalar zurück, wenn eine einzelne Funktion mit Series.agg() aufgerufen wird.
  • Es gibt eine Series zurück, wenn eine einzelne Funktion mit DataFrame.agg() aufgerufen wird.
  • Es gibt einen Dataframe zurück, wenn mehrere Funktionen mit DataFrame.agg() aufgerufen werden.

Beispiel-Codes: Pandas DataFrame.agg()

DataFrame.agg() ist ein Alias für DataFrame.aggregate(). Es ist besser, den Alias zu verwenden. Daher werden wir DataFrame.agg() in den Beispielcodes verwenden.

import pandas as pd

dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
                    'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
                    'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print(dataframe)

Das Beispiel DataFrame befindet sich weiter unten.

   Attendance    Name Obtained Marks
0          60  Olivia            90
1         100    John            75
2          80   Laura            82
3          78     Ben            64
4          95   Kevin            45

Wir werden zunächst die Funktion DataFrame.agg() überprüfen, indem wir nur eine einzige Aggregationsfunktion verwenden.

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

dataframe1 = dataframe.agg("sum")
print(dataframe1)

Ausgabe:

Attendance                            413
Name              OliviaJohnLauraBenKevin
Obtained Marks                        356
dtype: object

Die Aggregationsfunktion sum wird auf die einzelnen Spalten angewendet.

Für eine Spalte vom Typ integer hat sie eine Summe erzeugt; und für eine Spalte vom Typ string hat sie die Zeichenketten verkettet. dtype: object zeigt, dass eine Series zurückgegeben wird.

Beispielcodes: DataFrame.aggregate() Mit den Mehrfachfunktionen

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

dataframe1 = dataframe.agg(["sum", "min"])
print(dataframe1)

Ausgabe:

     Attendance                     Name  Obtained Marks
sum         413  OliviaJohnLauraBenKevin             356
min          60                      Ben              45

Die Aggregationsfunktionen sum und min werden auf die einzelnen Spalten angewendet.

Für eine Spalte vom Typ integer hat die Funktion min den minimalen Wert erzeugt, und für eine Spalte vom Typ string hat sie die Zeichenkette mit der minimalen Länge angezeigt.

Beispielcodes: DataFrame.aggregate() mit einer spezifizierten Spalte

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)

dataframe1 = dataframe.agg({"Obtained Marks": "sum"})
print(dataframe1)

Ausgabe:

Obtained Marks    356
dtype: int64

Es wird die Summe einer einzelnen Spalte zurückgegeben. dtype: int64 zeigt, dass diese Funktion eine Series zurückgegeben hat.

Wir könnten auch mehrere Funktionen auf eine einzelne Spalte anwenden.

import pandas as pd

dataframe = pd.DataFrame(
    {
        "Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
        "Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
        "Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
    }
)
dataframe1 = dataframe.agg({"Obtained Marks": ["sum", "max"]})
print(dataframe1)

Ausgabe:

     Obtained Marks
sum             356
max              90

Verwandter Artikel - Pandas DataFrame