Berechnen Sie den Mittelwert einer gruppierten Daten in Pandas
-
Verwenden Sie
groupby.mean()
, um den Mittelwert einer einzelnen Spalte in Pandas zu berechnen -
Verwenden Sie
groupby.mean()
, um den Mittelwert mehrerer Spalten in Pandas zu berechnen -
Verwenden Sie die
agg()
-Methode, um den Mittelwert einer gruppierten Daten in Pandas zu berechnen
Pandas ist eine Open-Source-Datenanalysebibliothek in Python. Es bietet viele integrierte Methoden, um Operationen mit numerischen Daten durchzuführen.
groupby()
ist eine der in Pandas verfügbaren Methoden, die die Daten nach bestimmten Kriterien in mehrere Gruppen aufteilt. Danach können wir verschiedene Methoden auf die gruppierten Daten anwenden, wie count()
, mean()
usw.
Dieses Tutorial zeigt, wie man den Mittelwert gruppierter Daten mit der Methode groupby.mean()
in Pandas findet.
Verwenden Sie groupby.mean()
, um den Mittelwert einer einzelnen Spalte in Pandas zu berechnen
Hier haben wir die Daten der Schüler im Pandas-Datenrahmenobjekt, wobei die Daten nach Abteilung gruppiert sind. Wir werden zwei Gruppen für zwei Abteilungen haben.
Dann berechnen wir die Durchschnittsnoten der Studenten jeder Gruppe oder Abteilung durch die Methode groupby.mean()
in einer einzigen Spalte, d.h. Noten
. In der Ausgabe erhalten wir die Durchschnittsnoten der Studierenden der CS- und SE-Fachbereiche.
Beispielcode:
# Python 3.x
import pandas as pd
df = pd.DataFrame(
{
"Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
"Department": ["CS", "SE", "SE", "SE", "CS"],
"Marks": [60, 81, 79, 51, 88],
"Age": [20, 21, 20, 22, 23],
}
)
display(df)
df.groupby("Department")["Marks"].mean()
Ausgang:
Verwenden Sie groupby.mean()
, um den Mittelwert mehrerer Spalten in Pandas zu berechnen
Wir können auch den Mittelwert mehrerer Spalten gleichzeitig nehmen, nachdem wir die Daten gruppiert haben, indem wir die Namen aller Probleme angeben, für die wir den Mittelwert berechnen möchten. Im folgenden Code haben wir die Daten nach Fachbereich aufgesplittet und daraus die durchschnittlichen Noten
und Alter
der Studierenden errechnet.
Beispielcode:
# Python 3.x
import pandas as pd
df = pd.DataFrame(
{
"Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
"Department": ["CS", "SE", "SE", "SE", "CS"],
"Marks": [60, 81, 79, 51, 88],
"Age": [20, 21, 20, 22, 23],
}
)
display(df)
df.groupby("Department")["Marks", "Age"].mean()
Ausgang:
Verwenden Sie die agg()
-Methode, um den Mittelwert einer gruppierten Daten in Pandas zu berechnen
Alternativ können wir auch die Methode agg()
verwenden, um den Mittelwert auf einer Gruppe durch das Objekt zu berechnen. Wir übergeben mean
als Argument an die agg()
-Methode.
Beispielcode:
# Python 3.x
import pandas as pd
df = pd.DataFrame(
{
"Name": ["Robert", "Sam", "Alia", "Jhon", "Smith"],
"Department": ["CS", "SE", "SE", "SE", "CS"],
"Marks": [60, 81, 79, 51, 88],
"Age": [20, 21, 20, 22, 23],
}
)
display(df)
df.groupby("Department")["Marks"].agg("mean")
Ausgang:
I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.
LinkedIn