Pandas DataFrame DataFrame.mean() Função
-
Sintaxe de
pandas.DataFrame.mean()
: -
Códigos de exemplo:
DataFrame.mean()
Método para encontrar a média ao longo do eixo da coluna -
Códigos de exemplo:
DataFrame.mean()
Método para encontrar a média ao longo do eixo da linha -
Códigos de exemplo:
DataFrame.mean()
Método para encontrar a média ignorando os valoresNaN
A função Python Pandas DataFrame.mean()
calcula a média dos valores do objeto DataFrame sobre o eixo especificado.
Sintaxe de pandas.DataFrame.mean()
:
DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Parâmetros
axis |
encontrar média ao longo da linha (axis=0) ou coluna (axis=1) |
skipna |
Booleano. Excluir valores NaN (skipna=True ) ou incluir valores NaN (skipna=False ) |
level |
Conte junto com um nível particular se o eixo for MultiIndex . |
numeric_only |
Booleano. Para colunas numeric_only=True , incluir apenas colunas float , int , e boolean . |
**kwargs |
Argumentos adicionais de palavras-chave para a função. |
Retornar
Se o level
não for especificado, retornar Series
da média dos valores para o eixo solicitado, caso contrário, retornar DataFrame
dos valores médios.
Códigos de exemplo: DataFrame.mean()
Método para encontrar a média ao longo do eixo da coluna
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean()
print("Means of Each Column:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Means of Each Column:
X 2.00
Y 4.75
dtype: float64
Ele calcula a média para ambas as colunas X
e Y
e finalmente retorna um objeto Series
com a média de cada coluna.
Para encontrar a média de uma coluna específica de DataFrame
em Pandas, chamamos a função mean()
somente para aquela coluna.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df["X"].mean()
print("Mean of Column X:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Column X:
2.0
Ela dá apenas a média dos valores da coluna X
de DataFrame
.
Códigos de exemplo: DataFrame.mean()
Método para encontrar a média ao longo do eixo da linha
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean(axis=1)
print("Mean of Rows:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Rows:
0 2.5
1 2.5
2 5.0
3 3.5
dtype: float64
Ele calcula a média de todas as linhas e finalmente retorna um objeto Series
com a média de cada linha.
Para encontrar a média de uma determinada linha de DataFrame
em Pandas, chamamos a função mean()
apenas para essa linha.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of 1st Row:
0 2.5
dtype: float64
Ela fornece apenas a média dos valores da primeira linha de DataFrame
.
Utilizamos o método iloc
para selecionar linhas com base no índice.
Códigos de exemplo: DataFrame.mean()
Método para encontrar a média ignorando os valores NaN
Utilizamos o valor padrão do parâmetro skipna
, ou seja, skipna=True
para encontrar a média de DataFrame
ao longo do eixo especificado, ignorando os valores NaN
.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=True)
print("Mean of Columns")
print(means)
Resultado:
DataFrame:
X Y
0 1.0 4.0
1 2.0 3.0
2 NaN NaN
3 3.0 4.0
Mean of Columns
X 2.000000
Y 3.666667
dtype: float64
Se definirmos skipna=True
, ele ignora o NaN
no dataframe. Isso nos permite calcular a média de DataFrame
ao longo do eixo da coluna, ignorando os valores NaN
.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)
Resultado:
DataFrame:
X Y
0 1.0 4
1 2.0 3
2 NaN 3
3 3.0 4
Mean of Columns
X NaN
Y 3.5
dtype: float64
Aqui, obtemos o valor NaN
para a média da coluna X
, pois a coluna X
tem o valor NaN
presente nela.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn