Pandas DataFrame DataFrame.sum() Función
-
La sintaxis de
pandas.DataFrame.sum()
: -
Códigos de ejemplo:
DataFrame.sum()
Método para calcular la suma a lo largo del eje de la columna -
Códigos de ejemplo:
DataFrame.sum()
Método para encontrar la suma a lo largo del eje de la fila -
Códigos de ejemplo:
DataFrame.sum()
Método para encontrar la suma ignorando los valoresNaN
-
Códigos de ejemplo: Ponga
min_count
enDataFrame.sum()
Método
La función de los pandas pitón DataFrame.sum()
es calcular la suma de valores del objeto DataFrame
sobre el eje especificado.
La sintaxis de pandas.DataFrame.sum()
:
DataFrame.sum(
axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs
)
Parámetros
axis |
encontrar la suma a lo largo de la fila (axis=0) o columna (axis=1) |
skipna |
Booleana. Excluir los valores NaN (skipna=True ) o incluir los valores NaN (skipna=False ) |
level |
Cuenta junto con el nivel particular si el eje es Multi-Index . |
numeric_only |
Booleana. Para numeric_only = True , incluye sólo las columnas float , int y boolean . |
min_count |
Entero. Número mínimo de valores no-NaN para calcular la suma. Si esta condición no se cumple, la suma será NaN . |
**kwargs |
Argumentos de palabras clave adicionales a la función. |
Retorna
Si no se especifica el level
, devuelve Series
de la suma de los valores del eje solicitado, si no, devuelve DataFrame
de los valores de la suma.
Códigos de ejemplo: DataFrame.sum()
Método para calcular la suma a lo largo del eje de la columna
import pandas as pd
df = pd.DataFrame({'X':
[1,2,3,4,5],
'Y': [1, 2, 3,4,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum()
print("Column-wise Sum:")
print(sums)
Producción:
DataFrame:
X Y Z
0 1 1 3
1 2 2 4
2 3 3 5
3 4 4 6
4 5 5 3
Column-wise Sum:
X 15
Y 15
Z 21
dtype: int64
Calcula la suma de todas las columnas X
, Y
y Z
y finalmente devuelve un objeto Series
con la suma de cada columna.
Para encontrar la suma de una columna particular de DataFrame
en Pandas, necesitas llamar a la función sum()
sólo para esa columna.
import pandas as pd
df = pd.DataFrame({'X':
[1,2,3,4,5],
'Y': [1, 2, 3,4,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df["Z"].sum()
print("Sum of values of Z-column:")
print(sums)
Producción:
DataFrame:
X Y Z
0 1 1 3
1 2 2 4
2 3 3 5
3 4 4 6
4 5 5 3
Sum of values of Z-column:
21
Sólo da la suma de los valores de la columna Z
de DataFrame
.
Códigos de ejemplo: DataFrame.sum()
Método para encontrar la suma a lo largo del eje de la fila
import pandas as pd
df = pd.DataFrame({'X':
[1,2,3,4,5],
'Y': [1, 2, 3,4,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum(axis=1)
print("Row-wise sum:")
print(sums)
Producción:
DataFrame:
X Y Z
0 1 1 3
1 2 2 4
2 3 3 5
3 4 4 6
4 5 5 3
Row-wise sum:
0 5
1 8
2 11
3 14
4 13
dtype: int64
Calcula la suma de todas las filas y finalmente devuelve un objeto Series
con la suma de cada fila.
Para encontrar la suma de una fila particular de DataFrame
en Pandas, necesitas llamar a la función sum()
para esa fila específica solamente.
import pandas as pd
df = pd.DataFrame({'X':
[1,2,3,4,5],
'Y': [1, 2, 3,4,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sum_3=df.iloc[[2]].sum(axis=1)
print("Sum of values of 3rd Row:")
print(sum_3)
Producción:
DataFrame:
X Y Z
0 1 1 3
1 2 2 4
2 3 3 5
3 4 4 6
4 5 5 3
Sum of values of 3rd Row:
2 11
dtype: int64
Sólo da la suma de los valores de la 3ª fila de DataFrame
.
Usa el método iloc
para seleccionar filas basadas en el índice.
Códigos de ejemplo: DataFrame.sum()
Método para encontrar la suma ignorando los valores NaN
Usa el valor por defecto del parámetro skipna
, es decir, skipna=True
para encontrar la suma de DataFrame
a lo largo del eje especificado, ignorando los valores NaN
.
import pandas as pd
df = pd.DataFrame({'X':
[1,None,3,4,5],
'Y': [1, None, 3,None,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum()
print("Column-wise Sum:")
print(sums)
Producción:
DataFrame:
X Y Z
0 1.0 1.0 3
1 NaN NaN 4
2 3.0 3.0 5
3 4.0 NaN 6
4 5.0 5.0 3
Column-wise Sum:
X 13.0
Y 9.0
Z 21.0
dtype: float64
Si estableces skipna=True
, obtendrás valores NaN
de las sumas si el DataFrame tiene valores NaN
.
import pandas as pd
df = pd.DataFrame({'X':
[1,None,3,4,5],
'Y': [1, None, 3,None,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum(skipna=False)
print("Column-wise Sum:")
print(sums)
Producción:
DataFrame:
X Y Z
0 1.0 1.0 3
1 NaN NaN 4
2 3.0 3.0 5
3 4.0 NaN 6
4 5.0 5.0 3
Column-wise Sum:
X NaN
Y NaN
Z 21.0
dtype: float64
Aquí, obtienes el valor NaN
de la suma de las columnas X
y Y
ya que ambas tienen los valores NaN
en ellas.
Códigos de ejemplo: Ponga min_count
en DataFrame.sum()
Método
import pandas as pd
df = pd.DataFrame({'X':
[1,None,3,4,5],
'Y': [1, None, 3,None,5],
'Z': [3,4,5,6,3]})
print("DataFrame:")
print(df)
sums=df.sum(min_count=4)
print("Column-wise Sum:")
print(sums)
Producción:
DataFrame:
X Y Z
0 1.0 1.0 3
1 NaN NaN 4
2 3.0 3.0 5
3 4.0 NaN 6
4 5.0 5.0 3
Column-wise Sum:
X 13.0
Y NaN
Z 21.0
dtype: float64
Aquí, se obtiene el valor NaN
para la suma de la columna Y
ya que la columna Y
sólo tiene valores 3
no-NaN
, que es menor que el valor del parámetro min_count
.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn