Pandas Groupby Beschreiben

Zeeshan Afridi 21 Juni 2023
  1. Verwenden Sie Pandas groupby().describe() in Python
  2. Abschluss
Pandas Groupby Beschreiben

Pandas ist eine der nützlichsten und am weitesten verbreiteten Bibliotheken für die Datenanalyse; Allerdings ist es nicht einfach, die Daten zu analysieren, aber Pandas hat uns glücklicherweise viele nützliche Funktionen zur Verfügung gestellt. Und eine der nützlichen Funktionen ist die Funktion groupby.describe().

describe() wird verwendet, um die Daten schnell zusammenzufassen und statistische Analysen für beliebige Variablen oder Gruppen bereitzustellen. Das describe() kann auf den gesamten Datensatz, einzelne Spalten oder eine Gruppe von Spalten angewendet werden.

Die Syntax von groupby.describe() ist unten.

df.groupby("var_a")["var_b"].describe()

Verwenden Sie Pandas groupby().describe() in Python

Die groupby()-Funktionen helfen, den Datensatz basierend auf verschiedenen Variablen in Untergruppen zu gruppieren. Wir können den Datensatz basierend auf einer oder mehreren Variablen gruppieren, während die Funktionen describe() uns eine statistische Analyse der Gruppen liefern.

Aber bevor wir uns mit den Details der Gruppe befassen und die Daten analysieren, erstellen wir zunächst einen Datenrahmen.

# import pandas
import pandas as pd

# create DataFrame
df = pd.DataFrame(
    {
        "teams": ["A", "B", "C", "D", "E", "F"],
        "points": [8, 12, 14, 14, 15, 22],
        "assists": [2, 9, 3, 5, 7, 6],
    }
)

# view DataFrame
print(df)

Ausgang:

  	teams  points  assists
0    A       8        2
1    B      12        9
2    C      14        3
3    D      14        5
4    E      15        7
5    F      22        6

Bisher haben wir einen Datenrahmen erstellt; Als nächstes gruppieren wir die Daten mit der Funktion groupby() und sehen uns die statistische Analyse mit der Funktion describe() an.

# import pandas
import pandas as pd

# create DataFrame
df = pd.DataFrame(
    {
        "teams": ["A", "B", "C", "D", "E", "F"],
        "points": [8, 12, 14, 14, 15, 22],
        "assists": [2, 9, 3, 5, 7, 6],
    }
)


# create a group
group = df.groupby("points")
print(group.first())
print("\n\n********** Group stats **********")

# see the stats using
group_stats = df.groupby("points").describe()
print(group_stats)

Ausgang:

team  assists
points
8         A        2
12        B        9
14        C        3
15        E        7
22        F        6


********** Group stats **********
         assists
         count mean       std  min  25%  50%  75%  max
points
8          1.0  2.0       NaN  2.0  2.0  2.0  2.0  2.0
12         1.0  9.0       NaN  9.0  9.0  9.0  9.0  9.0
14         2.0  4.0  1.414214  3.0  3.5  4.0  4.5  5.0
15         1.0  7.0       NaN  7.0  7.0  7.0  7.0  7.0
22         1.0  6.0       NaN  6.0  6.0  6.0  6.0  6.0

Wie Sie im obigen Beispiel sehen können, gruppieren wir die Daten basierend auf Punkten und wenden dann describe() wie folgt an group_stats = df.groupby('points').describe(). Wie Sie sehen können, sehen wir jetzt die Statistiken wie min, max, std usw.

Abschluss

Um den Artikel zum Gruppieren von Daten und Anzeigen der Statistiken mit der Funktion groupby.describe() zusammenzufassen, haben wir besprochen, was die Funktionen groupby() und describe() sind und wie sie funktionieren. Darüber hinaus haben wir die verschiedenen statistischen Funktionen besprochen, die von der Funktion describe() zur Analyse der Daten in Python verwendet werden.

Zeeshan Afridi avatar Zeeshan Afridi avatar

Zeeshan is a detail oriented software engineer that helps companies and individuals make their lives and easier with software solutions.

LinkedIn

Verwandter Artikel - Pandas Groupby