Pandas DataFrame DataFrame.sum()-Funktion

Suraj Joshi 30 Januar 2023
  1. Syntax von Pandas.dataFrame.sum():
  2. Beispielcodes: DataFrame.sum() Methode zur Berechnung der Summe entlang der Spaltenachse
  3. Beispielcodes: DataFrame.sum() Methode zur Ermittlung der Summe entlang der Zeilenachse
  4. Beispielcodes: DataFrame.sum() Methode, um die Summe zu finden, wobei NaN-Werte ignoriert werden
  5. Beispiel-Codes: Setzen Sie min_count in der Methode DataFrame.sum()
Pandas DataFrame DataFrame.sum()-Funktion

Die Funktion des Python Pandas DataFrame.sum() berechnet die Summe der Werte des DataFrame-Objektes über die angegebene Achse.

Syntax von Pandas.dataFrame.sum():

DataFrame.sum(
    axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs
)

Parameter

axis die Summe entlang der Zeile (axis=0) oder Spalte (axis=1) finden
skipna Boolesch. Ausschließen von NaN-Werten (skipna=True) oder Einschließen von NaN-Werten (skipna=False)
level Zählen Sie mit einem bestimmten Pegel mit, wenn die Achse MultiIndex ist.
numeric_only Boolesch. Fügen Sie für numeric_only=True nur die Spalten float, int und boolean ein.
min_count Ganze Zahl. Minimale Anzahl von non-NaN-Werten zur Berechnung der Summe. Wenn diese Bedingung nicht erfüllt ist, ist die Summe NaN.
**kwargs Zusätzliche Schlüsselwort-Argumente zu der Funktion.

Zurück

Wenn der level nicht angegeben ist, geben Sie Series der Summe der Werte für die angeforderte Achse zurück, andernfalls DataFrame der Summenwerte.

Beispielcodes: DataFrame.sum() Methode zur Berechnung der Summe entlang der Spaltenachse

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum()
print("Column-wise Sum:")
print(sums)

Ausgabe:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Column-wise Sum:
X    15
Y    15
Z    21
dtype: int64

Es berechnet die Summe für alle Spalten X, Y und Z und gibt schließlich ein Series-Objekt mit der Summe jeder Spalte zurück.

Um die Summe einer bestimmten Spalte von DataFrame in Pandas zu ermitteln, müssen Sie die Funktion Summe() nur für diese Spalte aufrufen.

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df["Z"].sum()
print("Sum of values of Z-column:")
print(sums)

Ausgabe:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Sum of values of Z-column:
21

Sie gibt nur die Summe der Werte der Spalte Z von DataFrame aus.

Beispielcodes: DataFrame.sum() Methode zur Ermittlung der Summe entlang der Zeilenachse

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum(axis=1)
print("Row-wise sum:")
print(sums)

Ausgabe:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Row-wise sum:
0     5
1     8
2    11
3    14
4    13
dtype: int64

Es berechnet die Summe für alle Zeilen und gibt schließlich ein Series-Objekt mit der Summe jeder Zeile zurück.

Um die Summe einer bestimmten Zeile von DataFrame in Pandas zu finden, müssen Sie die sum() Funktion nur für diese bestimmte Zeile aufrufen.


import pandas as pd

df = pd.DataFrame({'X': 
                   [1,2,3,4,5], 
                   'Y': [1, 2, 3,4,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sum_3=df.iloc[[2]].sum(axis=1)
print("Sum of values of 3rd Row:")
print(sum_3)

Ausgabe:

DataFrame:
   X  Y  Z
0  1  1  3
1  2  2  4
2  3  3  5
3  4  4  6
4  5  5  3
Sum of values of 3rd Row:
2    11
dtype: int64

Sie gibt nur die Summe der Werte der 3. Zeile des DataFrame aus.

Verwenden Sie die iloc-Methode, um Zeilen basierend auf dem Index auszuwählen.

Beispielcodes: DataFrame.sum() Methode, um die Summe zu finden, wobei NaN-Werte ignoriert werden

Verwenden Sie den Standardwert des Parameters skipna, d.h. skipna=True, um die Summe der DataFrame entlang der angegebenen Achse zu ermitteln, wobei die NaN-Werte ignoriert werden.

import pandas as pd
df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum()
print("Column-wise Sum:")
print(sums)

Ausgabe:

DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X    13.0
Y     9.0
Z    21.0
dtype: float64

Wenn Sie skipna=True setzen, erhalten Sie NaN-Werte von Summen, wenn der DataFrame NaN-Werte hat.


import pandas as pd

df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum(skipna=False)
print("Column-wise Sum:")
print(sums)

Ausgabe:

DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X     NaN
Y     NaN
Z    21.0
dtype: float64

Hier erhalten Sie den NaN-Wert für die Summe der Spalten X und Y, da beide Spalten die NaN-Werte enthalten.

Beispiel-Codes: Setzen Sie min_count in der Methode DataFrame.sum()

import pandas as pd

df = pd.DataFrame({'X': 
                   [1,None,3,4,5], 
                   'Y': [1, None, 3,None,5], 
                   'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)

sums=df.sum(min_count=4)
print("Column-wise Sum:")
print(sums)

Ausgabe:

DataFrame:
     X    Y  Z
0  1.0  1.0  3
1  NaN  NaN  4
2  3.0  3.0  5
3  4.0  NaN  6
4  5.0  5.0  3
Column-wise Sum:
X    13.0
Y     NaN
Z    21.0
dtype: float64

Hier erhalten Sie den NaN-Wert für die Summe der Spalte Y, da Spalte Y nur 3 Nicht- NaN-Werte hat, was kleiner ist als der Wert des Parameters min_count.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Verwandter Artikel - Pandas DataFrame