Funzione Pandas DataFrame DataFrame.aggregate()
-
Sintassi di
pandas.DataFrame.aggregate()
-
Codici di esempio: Pandas
DataFrame.aggregate()
-
Codici di esempio:
DataFrame.aggregate()
con le funzioni multiple -
Codici di esempio:
DataFrame.aggregate()
con una colonna specificata
La funzione pandas.DataFrame.aggregate()
aggrega le colonne o le righe di un DataFrame
. Le funzioni di aggregazione più comunemente utilizzate sono min
, max
e sum
. Queste funzioni di aggregazione determinano la riduzione delle dimensioni del DataFrame
.
Sintassi di pandas.DataFrame.aggregate()
DataFrame.aggregate(func, axis, *args, **kwargs)
Parametri
func |
È la funzione di aggregazione da applicare. Può essere un callable o una lista di callable , una stringa o una lista di stringhe o un dizionario. |
axis |
0 per impostazione predefinita. Se è 0 o 'index' , la funzione viene applicata alle singole colonne. Se è 1 o 'columns' , la funzione viene applicata alle singole righe |
*args |
È un argomento posizionale. |
**kwargs |
È un argomento di parole chiave. |
Ritorno
Questa funzione restituisce uno scalare
, una serie
o un DataFrame
.
- Restituisce uno
scalare
se una singola funzione viene chiamata conSeries.agg()
. - Restituisce una
Series
se una singola funzione viene chiamata conDataFrame.agg()
. - Restituisce un
DataFrame
se più funzioni vengono chiamate conDataFrame.agg()
.
Codici di esempio: Pandas DataFrame.aggregate()
DataFrame.agg()
è un alias per DataFrame.aggregate()
. È meglio usare l’alias. Quindi useremo DataFrame.agg()
nei codici di esempio.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print(dataframe)
L’esempio DataFrame
è di seguito.
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Per prima cosa controlleremo la funzione DataFrame.agg()
utilizzando solo una singola funzione di aggregazione.
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg("sum")
print(dataframe1)
Produzione:
Attendance 413
Name OliviaJohnLauraBenKevin
Obtained Marks 356
dtype: object
La funzione aggregata sum
viene applicata alle singole colonne.
Per la colonna di tipo intero
, ha generato la somma; e per la colonna di tipo stringa
, ha concatenato le stringhe. dtype: object
mostra che viene restituita una Series
.
Codici di esempio: DataFrame.aggregate()
con le funzioni multiple
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg(["sum", "min"])
print(dataframe1)
Produzione:
Attendance Name Obtained Marks
sum 413 OliviaJohnLauraBenKevin 356
min 60 Ben 45
Le funzioni di aggregazione sum
e min
vengono applicate alle singole colonne.
Per la colonna di tipo intero
, la funzione min
ha generato il valore minimo, e per la colonna di tipo stringa
, ha mostrato la stringa di lunghezza minima.
Codici di esempio: DataFrame.aggregate()
con una colonna specificata
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"Obtained Marks": "sum"})
print(dataframe1)
Produzione:
Obtained Marks 356
dtype: int64
Viene restituita la somma di una singola colonna. dtype: int64
mostra che questa funzione ha restituito una Series
.
Potremmo anche applicare più funzioni su una singola colonna.
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"Obtained Marks": ["sum", "max"]})
print(dataframe1)
Produzione:
Obtained Marks
sum 356
max 90