Pandas DataFrame DataFrame.sum()-Funktion
-
Syntax von
Pandas.dataFrame.sum()
: -
Beispielcodes:
DataFrame.sum()
Methode zur Berechnung der Summe entlang der Spaltenachse -
Beispielcodes:
DataFrame.sum()
Methode zur Ermittlung der Summe entlang der Zeilenachse -
Beispielcodes:
DataFrame.sum()
Methode, um die Summe zu finden, wobeiNaN
-Werte ignoriert werden -
Beispiel-Codes: Setzen Sie
min_count
in der MethodeDataFrame.sum()
Die Funktion des Python Pandas DataFrame.sum()
berechnet die Summe der Werte des DataFrame
-Objektes über die angegebene Achse.
Syntax von Pandas.dataFrame.sum()
:
DataFrame.sum(
axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs
)
Parameter
axis |
die Summe entlang der Zeile (axis=0) oder Spalte (axis=1) finden |
skipna |
Boolesch. Ausschließen von NaN -Werten (skipna=True ) oder Einschließen von NaN -Werten (skipna=False ) |
level |
Zählen Sie mit einem bestimmten Pegel mit, wenn die Achse MultiIndex ist. |
numeric_only |
Boolesch. Fügen Sie für numeric_only=True nur die Spalten float , int und boolean ein. |
min_count |
Ganze Zahl. Minimale Anzahl von non-NaN -Werten zur Berechnung der Summe. Wenn diese Bedingung nicht erfüllt ist, ist die Summe NaN . |
**kwargs |
Zusätzliche Schlüsselwort-Argumente zu der Funktion. |
Zurück
Wenn der level
nicht angegeben ist, geben Sie Series
der Summe der Werte für die angeforderte Achse zurück, andernfalls DataFrame
der Summenwerte.
Beispielcodes: DataFrame.sum()
Methode zur Berechnung der Summe entlang der Spaltenachse
import pandas as pd
df = pd.DataFrame({'X':
[1,2,3,4,5],
'Y': [1, 2, 3,4,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum()
print("Column-wise Sum:")
print(sums)
Ausgabe:
DataFrame:
X Y Z
0 1 1 3
1 2 2 4
2 3 3 5
3 4 4 6
4 5 5 3
Column-wise Sum:
X 15
Y 15
Z 21
dtype: int64
Es berechnet die Summe für alle Spalten X
, Y
und Z
und gibt schließlich ein Series
-Objekt mit der Summe jeder Spalte zurück.
Um die Summe einer bestimmten Spalte von DataFrame
in Pandas zu ermitteln, müssen Sie die Funktion Summe()
nur für diese Spalte aufrufen.
import pandas as pd
df = pd.DataFrame({'X':
[1,2,3,4,5],
'Y': [1, 2, 3,4,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df["Z"].sum()
print("Sum of values of Z-column:")
print(sums)
Ausgabe:
DataFrame:
X Y Z
0 1 1 3
1 2 2 4
2 3 3 5
3 4 4 6
4 5 5 3
Sum of values of Z-column:
21
Sie gibt nur die Summe der Werte der Spalte Z
von DataFrame
aus.
Beispielcodes: DataFrame.sum()
Methode zur Ermittlung der Summe entlang der Zeilenachse
import pandas as pd
df = pd.DataFrame({'X':
[1,2,3,4,5],
'Y': [1, 2, 3,4,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum(axis=1)
print("Row-wise sum:")
print(sums)
Ausgabe:
DataFrame:
X Y Z
0 1 1 3
1 2 2 4
2 3 3 5
3 4 4 6
4 5 5 3
Row-wise sum:
0 5
1 8
2 11
3 14
4 13
dtype: int64
Es berechnet die Summe für alle Zeilen und gibt schließlich ein Series
-Objekt mit der Summe jeder Zeile zurück.
Um die Summe einer bestimmten Zeile von DataFrame
in Pandas zu finden, müssen Sie die sum()
Funktion nur für diese bestimmte Zeile aufrufen.
import pandas as pd
df = pd.DataFrame({'X':
[1,2,3,4,5],
'Y': [1, 2, 3,4,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sum_3=df.iloc[[2]].sum(axis=1)
print("Sum of values of 3rd Row:")
print(sum_3)
Ausgabe:
DataFrame:
X Y Z
0 1 1 3
1 2 2 4
2 3 3 5
3 4 4 6
4 5 5 3
Sum of values of 3rd Row:
2 11
dtype: int64
Sie gibt nur die Summe der Werte der 3. Zeile des DataFrame
aus.
Verwenden Sie die iloc
-Methode, um Zeilen basierend auf dem Index auszuwählen.
Beispielcodes: DataFrame.sum()
Methode, um die Summe zu finden, wobei NaN
-Werte ignoriert werden
Verwenden Sie den Standardwert des Parameters skipna
, d.h. skipna=True
, um die Summe der DataFrame
entlang der angegebenen Achse zu ermitteln, wobei die NaN
-Werte ignoriert werden.
import pandas as pd
df = pd.DataFrame({'X':
[1,None,3,4,5],
'Y': [1, None, 3,None,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum()
print("Column-wise Sum:")
print(sums)
Ausgabe:
DataFrame:
X Y Z
0 1.0 1.0 3
1 NaN NaN 4
2 3.0 3.0 5
3 4.0 NaN 6
4 5.0 5.0 3
Column-wise Sum:
X 13.0
Y 9.0
Z 21.0
dtype: float64
Wenn Sie skipna=True
setzen, erhalten Sie NaN
-Werte von Summen, wenn der DataFrame NaN
-Werte hat.
import pandas as pd
df = pd.DataFrame({'X':
[1,None,3,4,5],
'Y': [1, None, 3,None,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum(skipna=False)
print("Column-wise Sum:")
print(sums)
Ausgabe:
DataFrame:
X Y Z
0 1.0 1.0 3
1 NaN NaN 4
2 3.0 3.0 5
3 4.0 NaN 6
4 5.0 5.0 3
Column-wise Sum:
X NaN
Y NaN
Z 21.0
dtype: float64
Hier erhalten Sie den NaN
-Wert für die Summe der Spalten X
und Y
, da beide Spalten die NaN
-Werte enthalten.
Beispiel-Codes: Setzen Sie min_count
in der Methode DataFrame.sum()
import pandas as pd
df = pd.DataFrame({'X':
[1,None,3,4,5],
'Y': [1, None, 3,None,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum(min_count=4)
print("Column-wise Sum:")
print(sums)
Ausgabe:
DataFrame:
X Y Z
0 1.0 1.0 3
1 NaN NaN 4
2 3.0 3.0 5
3 4.0 NaN 6
4 5.0 5.0 3
Column-wise Sum:
X 13.0
Y NaN
Z 21.0
dtype: float64
Hier erhalten Sie den NaN
-Wert für die Summe der Spalte Y
, da Spalte Y
nur 3
Nicht- NaN
-Werte hat, was kleiner ist als der Wert des Parameters min_count
.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn