Funzione Pandas DataFrame.describe()
Minahil Noor
30 gennaio 2023
-
Sintassi di
pandas.DataFrame.describe()
: -
Codici di esempio: Metodo
DataFrame.describe()
per trovare le statistiche di un DataFrame -
Codici di esempio: Metodo
DataFrame.describe()
per trovare le statistiche di ciascuna colonna -
Codici di esempio: Metodo
DataFrame.describe()
per trovare le statistiche di colonne numeriche
La funzione Python Pandas DataFrame.describe()
racconta i dati statistici di un DataFrame.
Sintassi di pandas.DataFrame.describe()
:
DataFrame.describe(
percentiles=None, include=None, exclude=None, datetime_is_numeric=False
)
Parametri
percentiles |
Questo parametro indica i percentili da includere nell’output. Tutti i valori devono essere compresi tra 0 e 1. L’impostazione predefinita è [.25, .5, .75] , che restituisce il 25°, 50° e 75° percentile. |
include |
Specifica i tipi di dati da includere nell’output. Ha tre opzioni. all : tutte le colonne dell’input verranno incluse nell’output. Una lista di tipi di dati: limita i risultati ai tipi di dati forniti. None : il risultato includerà tutte le colonne numeriche. |
exclude |
Specifica i tipi di dati da escludere dall’output. Ha due opzioni. Una lista di tipi di dati: esclude i tipi di dati forniti dal risultato. None : il risultato non escluderà nulla. |
datetime_is_numeric |
Un parametro booleano. Indica se trattare i tipi di dati datetime come numerici. |
Ritorno
Restituisce il riepilogo delle statistiche della Series
o del Dataframe passato.
Codici di esempio: Metodo DataFrame.describe()
per trovare le statistiche di un DataFrame
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.describe()
print("Statistics are: \n")
print(dataframe1)
Produzione:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Statistics are:
Attendance Obtained Marks
count 5.000000 5.000000
mean 82.600000 71.200000
std 15.773395 17.484279
min 60.000000 45.000000
25% 78.000000 64.000000
50% 80.000000 75.000000
75% 95.000000 82.000000
max 100.000000 90.000000
La funzione ha restituito il riepilogo delle statistiche del DataFrame. Non abbiamo passato alcun parametro, quindi la funzione ha utilizzato tutti i valori predefiniti.
Codici di esempio: Metodo DataFrame.describe()
per trovare le statistiche di ciascuna colonna
Troveremo le statistiche di tutte le colonne utilizzando il parametro include
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.describe(include='all')
print("Statistics are: \n")
print(dataframe1)
Produzione:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Statistics are:
Attendance Name Obtained Marks
count 5.000000 5 5.000000
unique NaN 5 NaN
top NaN Kevin NaN
freq NaN 1 NaN
mean 82.600000 NaN 71.200000
std 15.773395 NaN 17.484279
min 60.000000 NaN 45.000000
25% 78.000000 NaN 64.000000
50% 80.000000 NaN 75.000000
75% 95.000000 NaN 82.000000
max 100.000000 NaN 90.000000
La funzione ha restituito il riepilogo delle statistiche di tutte le colonne del DataFrame.
Codici di esempio: Metodo DataFrame.describe()
per trovare le statistiche di colonne numeriche
Ora troveremo le statistiche delle colonne numeriche utilizzando solo il parametro exclude
.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.describe(exclude=[object])
print("Statistics are: \n")
print(dataframe1)
Produzione:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Statistics are:
Attendance Obtained Marks
count 5.000000 5.000000
mean 82.600000 71.200000
std 15.773395 17.484279
min 60.000000 45.000000
25% 78.000000 64.000000
50% 80.000000 75.000000
75% 95.000000 82.000000
max 100.000000 90.000000
Abbiamo escluso il tipo di dati object
.