Función Pandas DataFrame DataFrame.mean()
-
Sintaxis de
pandas.DataFrame.mean()
: -
Códigos de ejemplo:
DataFrame.mean()
Método para encontrar la media a lo largo del eje de la columna -
Códigos de ejemplo:
DataFrame.mean()
Método para encontrar la media a lo largo del eje de la fila -
Códigos de ejemplo:
DataFrame.mean()
Método para encontrar la media ignorando los valoresNaN
La función Python Pandas DataFrame.mean()
calcula la media de valores del objeto DataFrame sobre el eje especificado.
Sintaxis de pandas.DataFrame.mean()
:
DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Parámetros
axis |
encontrar la media a lo largo de la fila (axis=0) o fila (axis=1) |
skipna |
Booleana. Excluir los valores NaN (skipna=True) o incluir los valores NaN (skipna=False) |
level |
Cuenta junto con el nivel particular si el eje es MultiIndex . |
numeric_only |
Booleana. Para numeric_only = True , incluye sólo las columnas float , int y boolean . |
**kwargs |
Argumentos de palabras clave adicionales a la función. |
Retorna
Si no se especifica el level
, devuelve Series
de la media de los valores del eje solicitado, si no, devuelve DataFrame
de los valores medios.
Códigos de ejemplo: DataFrame.mean()
Método para encontrar la media a lo largo del eje de la columna
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean()
print("Means of Each Column:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Means of Each Column:
X 2.00
Y 4.75
dtype: float64
Calcula la media de ambas columnas X
y Y
y finalmente devuelve un objeto Series
con la media de cada columna.
Para encontrar la media de una columna particular de DataFrame
en Pandas, llamamos a la función mean()
para esa columna solamente.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df["X"].mean()
print("Mean of Column X:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Column X:
2.0
Sólo da la media de los valores de la columna X
de DataFrame
.
Códigos de ejemplo: DataFrame.mean()
Método para encontrar la media a lo largo del eje de la fila
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean(axis=1)
print("Mean of Rows:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Rows:
0 2.5
1 2.5
2 5.0
3 3.5
dtype: float64
Calcula la media de todas las filas y finalmente devuelve un objeto Series
con la media de cada fila.
Para encontrar la media de una fila particular de DataFrame
en Pandas, llamamos a la función mean()
para esa fila solamente.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of 1st Row:
0 2.5
dtype: float64
Sólo da la media de los valores de la primera fila de DataFrame
.
Usamos el método iloc
para seleccionar filas basadas en el índice.
Códigos de ejemplo: DataFrame.mean()
Método para encontrar la media ignorando los valores NaN
Usamos el valor por defecto del parámetro skipna
, es decir, skipna=True
para encontrar la media de DataFrame
a lo largo del eje especificado ignorando los valores NaN
.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=True)
print("Mean of Columns")
print(means)
Resultado:
DataFrame:
X Y
0 1.0 4.0
1 2.0 3.0
2 NaN NaN
3 3.0 4.0
Mean of Columns
X 2.000000
Y 3.666667
dtype: float64
Si establecemos skipna=True
, ignora el NaN
en el dataframe. Nos permite calcular la media del DataFrame
a lo largo del eje de la columna ignorando los valores NaN
.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)
Resultado:
DataFrame:
X Y
0 1.0 4
1 2.0 3
2 NaN 3
3 3.0 4
Mean of Columns
X NaN
Y 3.5
dtype: float64
Aquí, obtenemos el valor NaN
para la media de la columna X
, ya que la columna X
tiene el valor NaN
presente en ella.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn