Pandas DataFrame DataFrame.aggregate() Funktion
-
Syntax von
pandas.DataFrame.aggregate()
-
Beispiel-Codes: Pandas
DataFrame.agg()
-
Beispielcodes:
DataFrame.aggregate()
Mit den Mehrfachfunktionen -
Beispielcodes:
DataFrame.aggregate()
mit einer spezifizierten Spalte
Die Funktion pandas.DataFrame.aggregate()
aggregiert die Spalten oder Zeilen eines DataFrame
. Die am häufigsten verwendeten Aggregationsfunktionen sind min
, max
und sum
. Diese Aggregationsfunktionen führen zu einer Verringerung der Größe des DataFrame
.
Syntax von pandas.DataFrame.aggregate()
DataFrame.aggregate(func, axis, *args, **kwargs)
Parameter
func |
Es ist die anzuwendende Aggregationsfunktion. Sie kann eine callable oder eine Liste von callable , eine Zeichenkette oder eine Liste von Zeichenketten oder ein Dictionary sein. |
axis |
0 standardmäßig. Ist sie 0 oder 'index' , dann wird die Funktion auf die einzelnen Spalten angewendet. Wenn es 1 oder 'columns' ist, wird die Funktion auf die einzelnen Zeilen angewendet. |
*args |
Es ist ein Positionsargument. |
**kwargs |
Es ist ein Stichwortargument. |
Zurück
Diese Funktion gibt einen scalar
, eine Series
oder einen DataFrame
zurück.
- Sie gibt einen
scalar
zurück, wenn eine einzelne Funktion mitSeries.agg()
aufgerufen wird. - Es gibt eine
Series
zurück, wenn eine einzelne Funktion mitDataFrame.agg()
aufgerufen wird. - Es gibt einen
Dataframe
zurück, wenn mehrere Funktionen mitDataFrame.agg()
aufgerufen werden.
Beispiel-Codes: Pandas DataFrame.agg()
DataFrame.agg()
ist ein Alias für DataFrame.aggregate()
. Es ist besser, den Alias zu verwenden. Daher werden wir DataFrame.agg()
in den Beispielcodes verwenden.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print(dataframe)
Das Beispiel DataFrame
befindet sich weiter unten.
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Wir werden zunächst die Funktion DataFrame.agg()
überprüfen, indem wir nur eine einzige Aggregationsfunktion verwenden.
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg("sum")
print(dataframe1)
Ausgabe:
Attendance 413
Name OliviaJohnLauraBenKevin
Obtained Marks 356
dtype: object
Die Aggregationsfunktion sum
wird auf die einzelnen Spalten angewendet.
Für eine Spalte vom Typ integer
hat sie eine Summe erzeugt; und für eine Spalte vom Typ string
hat sie die Zeichenketten verkettet. dtype: object
zeigt, dass eine Series
zurückgegeben wird.
Beispielcodes: DataFrame.aggregate()
Mit den Mehrfachfunktionen
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg(["sum", "min"])
print(dataframe1)
Ausgabe:
Attendance Name Obtained Marks
sum 413 OliviaJohnLauraBenKevin 356
min 60 Ben 45
Die Aggregationsfunktionen sum
und min
werden auf die einzelnen Spalten angewendet.
Für eine Spalte vom Typ integer
hat die Funktion min
den minimalen Wert erzeugt, und für eine Spalte vom Typ string
hat sie die Zeichenkette mit der minimalen Länge angezeigt.
Beispielcodes: DataFrame.aggregate()
mit einer spezifizierten Spalte
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"Obtained Marks": "sum"})
print(dataframe1)
Ausgabe:
Obtained Marks 356
dtype: int64
Es wird die Summe einer einzelnen Spalte zurückgegeben. dtype: int64
zeigt, dass diese Funktion eine Series
zurückgegeben hat.
Wir könnten auch mehrere Funktionen auf eine einzelne Spalte anwenden.
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"Obtained Marks": ["sum", "max"]})
print(dataframe1)
Ausgabe:
Obtained Marks
sum 356
max 90