Pandas DataFrame.describe() Função
Minahil Noor
30 janeiro 2023
-
Sintaxe de
pandas.DataFrame.describe()
: -
Códigos de exemplo:
DataFrame.describe()
Método para encontrar as estatísticas de uma moldura de dados -
Códigos de exemplo:
DataFrame.describe()
Método para encontrar as estatísticas de cada coluna -
Códigos de exemplo:
DataFrame.describe()
Método para encontrar as estatísticas das colunas numéricas
Python Pandas DataFrame.describe()
função informa sobre os dados estatísticos de uma moldura de dados.
Sintaxe de pandas.DataFrame.describe()
:
DataFrame.describe(
percentiles=None, include=None, exclude=None, datetime_is_numeric=False
)
Parâmetros
percentiles |
Este parâmetro diz respeito aos percentis a incluir na produção. Todos os valores devem estar entre 0 e 1. O padrão é [.25, .5, .75] , que devolve os percentis 25, 50, e 75. |
include |
Fala sobre os tipos de dados a incluir na produção. Tem três opções. tudo : todas as colunas da entrada serão incluídas na saída. Uma lista semelhante à dos tipos de dados: limita os resultados aos tipos de dados fornecidos. None : O resultado incluirá todas as colunas numéricas. |
exclude |
Informa sobre os tipos de dados a excluir da produção. Tem duas opções. Uma lista semelhante aos tipos de dados: exclui os tipos de dados fornecidos do resultado. None : O resultado não exclui nada. |
datetime_is_numeric |
Um parâmetro booleano. Diz se deve tratar os tipos de dados de data e hora como numéricos. |
Devolver
Retorna o resumo das estatísticas da Series
ou Dataframe aprovado.
Códigos de exemplo: DataFrame.describe()
Método para encontrar as estatísticas de uma moldura de dados
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.describe()
print("Statistics are: \n")
print(dataframe1)
Resultado:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Statistics are:
Attendance Obtained Marks
count 5.000000 5.000000
mean 82.600000 71.200000
std 15.773395 17.484279
min 60.000000 45.000000
25% 78.000000 64.000000
50% 80.000000 75.000000
75% 95.000000 82.000000
max 100.000000 90.000000
A função devolveu o resumo das estatísticas do quadro de dados. Não passámos nenhum parâmetro, pelo que a função utilizou todos os valores por defeito.
Códigos de exemplo: DataFrame.describe()
Método para encontrar as estatísticas de cada coluna
Encontraremos as estatísticas de todas as colunas utilizando o parâmetro include
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.describe(include='all')
print("Statistics are: \n")
print(dataframe1)
Resultado:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Statistics are:
Attendance Name Obtained Marks
count 5.000000 5 5.000000
unique NaN 5 NaN
top NaN Kevin NaN
freq NaN 1 NaN
mean 82.600000 NaN 71.200000
std 15.773395 NaN 17.484279
min 60.000000 NaN 45.000000
25% 78.000000 NaN 64.000000
50% 80.000000 NaN 75.000000
75% 95.000000 NaN 82.000000
max 100.000000 NaN 90.000000
A função devolveu o resumo das estatísticas de todas as colunas da moldura de dados.
Códigos de exemplo: DataFrame.describe()
Método para encontrar as estatísticas das colunas numéricas
Agora vamos encontrar as estatísticas das colunas numéricas utilizando apenas o parâmetro exclude
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.describe(exclude=[object])
print("Statistics are: \n")
print(dataframe1)
Resultado:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Statistics are:
Attendance Obtained Marks
count 5.000000 5.000000
mean 82.600000 71.200000
std 15.773395 17.484279
min 60.000000 45.000000
25% 78.000000 64.000000
50% 80.000000 75.000000
75% 95.000000 82.000000
max 100.000000 90.000000
Excluímos o tipo de dados object
.