Pandas Groupby Beschreiben
Pandas ist eine der nützlichsten und am weitesten verbreiteten Bibliotheken für die Datenanalyse; Allerdings ist es nicht einfach, die Daten zu analysieren, aber Pandas hat uns glücklicherweise viele nützliche Funktionen zur Verfügung gestellt. Und eine der nützlichen Funktionen ist die Funktion groupby.describe()
.
describe()
wird verwendet, um die Daten schnell zusammenzufassen und statistische Analysen für beliebige Variablen oder Gruppen bereitzustellen. Das describe()
kann auf den gesamten Datensatz, einzelne Spalten oder eine Gruppe von Spalten angewendet werden.
Die Syntax von groupby.describe()
ist unten.
df.groupby("var_a")["var_b"].describe()
Verwenden Sie Pandas groupby().describe()
in Python
Die groupby()
-Funktionen helfen, den Datensatz basierend auf verschiedenen Variablen in Untergruppen zu gruppieren. Wir können den Datensatz basierend auf einer oder mehreren Variablen gruppieren, während die Funktionen describe()
uns eine statistische Analyse der Gruppen liefern.
Aber bevor wir uns mit den Details der Gruppe befassen und die Daten analysieren, erstellen wir zunächst einen Datenrahmen.
# import pandas
import pandas as pd
# create DataFrame
df = pd.DataFrame(
{
"teams": ["A", "B", "C", "D", "E", "F"],
"points": [8, 12, 14, 14, 15, 22],
"assists": [2, 9, 3, 5, 7, 6],
}
)
# view DataFrame
print(df)
Ausgang:
teams points assists
0 A 8 2
1 B 12 9
2 C 14 3
3 D 14 5
4 E 15 7
5 F 22 6
Bisher haben wir einen Datenrahmen erstellt; Als nächstes gruppieren wir die Daten mit der Funktion groupby()
und sehen uns die statistische Analyse mit der Funktion describe()
an.
# import pandas
import pandas as pd
# create DataFrame
df = pd.DataFrame(
{
"teams": ["A", "B", "C", "D", "E", "F"],
"points": [8, 12, 14, 14, 15, 22],
"assists": [2, 9, 3, 5, 7, 6],
}
)
# create a group
group = df.groupby("points")
print(group.first())
print("\n\n********** Group stats **********")
# see the stats using
group_stats = df.groupby("points").describe()
print(group_stats)
Ausgang:
team assists
points
8 A 2
12 B 9
14 C 3
15 E 7
22 F 6
********** Group stats **********
assists
count mean std min 25% 50% 75% max
points
8 1.0 2.0 NaN 2.0 2.0 2.0 2.0 2.0
12 1.0 9.0 NaN 9.0 9.0 9.0 9.0 9.0
14 2.0 4.0 1.414214 3.0 3.5 4.0 4.5 5.0
15 1.0 7.0 NaN 7.0 7.0 7.0 7.0 7.0
22 1.0 6.0 NaN 6.0 6.0 6.0 6.0 6.0
Wie Sie im obigen Beispiel sehen können, gruppieren wir die Daten basierend auf Punkten
und wenden dann describe()
wie folgt an group_stats = df.groupby('points').describe()
. Wie Sie sehen können, sehen wir jetzt die Statistiken wie min
, max
, std
usw.
Abschluss
Um den Artikel zum Gruppieren von Daten und Anzeigen der Statistiken mit der Funktion groupby.describe()
zusammenzufassen, haben wir besprochen, was die Funktionen groupby()
und describe()
sind und wie sie funktionieren. Darüber hinaus haben wir die verschiedenen statistischen Funktionen besprochen, die von der Funktion describe()
zur Analyse der Daten in Python verwendet werden.
Zeeshan is a detail oriented software engineer that helps companies and individuals make their lives and easier with software solutions.
LinkedIn