Pandas DataFrame DataFrame.mean() Função

Suraj Joshi 30 janeiro 2023
  1. Sintaxe de pandas.DataFrame.mean():
  2. Códigos de exemplo: DataFrame.mean() Método para encontrar a média ao longo do eixo da coluna
  3. Códigos de exemplo: DataFrame.mean() Método para encontrar a média ao longo do eixo da linha
  4. Códigos de exemplo: DataFrame.mean() Método para encontrar a média ignorando os valores NaN
Pandas DataFrame DataFrame.mean() Função

A função Python Pandas DataFrame.mean() calcula a média dos valores do objeto DataFrame sobre o eixo especificado.

Sintaxe de pandas.DataFrame.mean():

DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)

Parâmetros

axis encontrar média ao longo da linha (axis=0) ou coluna (axis=1)
skipna Booleano. Excluir valores NaN (skipna=True) ou incluir valores NaN (skipna=False)
level Conte junto com um nível particular se o eixo for MultiIndex.
numeric_only Booleano. Para colunas numeric_only=True, incluir apenas colunas float, int, e boolean.
**kwargs Argumentos adicionais de palavras-chave para a função.

Retornar

Se o level não for especificado, retornar Series da média dos valores para o eixo solicitado, caso contrário, retornar DataFrame dos valores médios.

Códigos de exemplo: DataFrame.mean() Método para encontrar a média ao longo do eixo da coluna

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean()
print("Means of Each Column:")
print(means)

Resultado:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Means of Each Column:
X    2.00
Y    4.75
dtype: float64

Ele calcula a média para ambas as colunas X e Y e finalmente retorna um objeto Series com a média de cada coluna.

Para encontrar a média de uma coluna específica de DataFrame em Pandas, chamamos a função mean() somente para aquela coluna.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df["X"].mean()
print("Mean of Column X:")
print(means)

Resultado:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Column X:
2.0

Ela dá apenas a média dos valores da coluna X de DataFrame.

Códigos de exemplo: DataFrame.mean() Método para encontrar a média ao longo do eixo da linha

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

means=df.mean(axis=1)
print("Mean of Rows:")
print(means)

Resultado:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of Rows:
0    2.5
1    2.5
2    5.0
3    3.5
dtype: float64

Ele calcula a média de todas as linhas e finalmente retorna um objeto Series com a média de cada linha.

Para encontrar a média de uma determinada linha de DataFrame em Pandas, chamamos a função mean() apenas para essa linha.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, 2, 3],
                   'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)

mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)

Resultado:

DataFrame:
   X  Y
0  1  4
1  2  3
2  2  8
3  3  4
Mean of 1st Row:
0    2.5
dtype: float64

Ela fornece apenas a média dos valores da primeira linha de DataFrame.

Utilizamos o método iloc para selecionar linhas com base no índice.

Códigos de exemplo: DataFrame.mean() Método para encontrar a média ignorando os valores NaN

Utilizamos o valor padrão do parâmetro skipna, ou seja, skipna=True para encontrar a média de DataFrame ao longo do eixo especificado, ignorando os valores NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)

means=df.mean(skipna=True)
print("Mean of Columns")
print(means)

Resultado:

DataFrame:
     X    Y
0  1.0  4.0
1  2.0  3.0
2  NaN  NaN
3  3.0  4.0
Mean of Columns
X    2.000000
Y    3.666667
dtype: float64

Se definirmos skipna=True, ele ignora o NaN no dataframe. Isso nos permite calcular a média de DataFrame ao longo do eixo da coluna, ignorando os valores NaN.

import pandas as pd

df = pd.DataFrame({'X': [1, 2, None, 3],
                   'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)

Resultado:

DataFrame:
     X  Y
0  1.0  4
1  2.0  3
2  NaN  3
3  3.0  4
Mean of Columns
X    NaN
Y    3.5
dtype: float64

Aqui, obtemos o valor NaN para a média da coluna X, pois a coluna X tem o valor NaN presente nela.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn

Artigo relacionado - Pandas DataFrame