Fonction Pandas DataFrame.resample()
Minahil Noor
30 janvier 2023
-
Syntaxe de
pandas.DataFrame.resample()
: -
Exemples de codes :
DataFrame.resample()
Méthode pour rééchantillonner les données des séries sur une base hebdomadaire -
Exemples de codes :
DataFrame.resample()
Méthode pour rééchantillonner les données des séries sur une base mensuelle
La fonction Python Pandas DataFrame.resample()
rééchantillonne les données de séries chronologiques.
Syntaxe de pandas.DataFrame.resample()
:
DataFrame.resample(
rule,
axis=0,
closed=None,
label=None,
convention="start",
kind=None,
loffset=None,
base=None,
on=None,
level=None,
origin="start_day",
offset=None,
)
Paramètres
rule |
Il s’agit de la chaîne ou de l’objet de décalage représentant la conversion de la cible. |
axis |
Il précise l’axe à utiliser pour l’échantillonnage ascendant ou descendant. Pour les séries, la valeur par défaut sera 0, c’est-à-dire le long des lignes. |
closed |
Il précise quel côté de l’intervalle de la poubelle est fermé. Deux options s’offrent à vous : right ou left . |
label |
Il précise l’étiquette du bord de la poubelle avec laquelle le seau doit être étiqueté. Deux possibilités s’offrent à vous : right ou left . |
convention |
Il y a quatre options : start , end , s , ou, e . Pour le PeriodIndex uniquement, il utilise le start ou la end de la règle. |
kind |
Il précise le type d’indice résultant. Deux options s’offrent à vous : timestamp ou period . L’horodatage convertit l’index résultant en un DateTimeIndex, et la période le convertit en un PeriodIndex. |
loffset |
Il ajuste les étiquettes horaires rééchantillonnées. |
base |
C’est un nombre entier. Sa valeur par défaut est 0. |
on |
Il représente le nom de la colonne à utiliser à la place de l’index pour le rééchantillonnage. La colonne doit être de type date-heure. |
level |
Il représente le nom du niveau à utiliser pour le rééchantillonnage. Le niveau doit être de type date-heure. |
origin |
Il s’agit de l’horodatage sur lequel il faut ajuster le regroupement. Il existe trois options : epoch , start ou start_day . |
offset |
Il représente un décalage timedelta ajouté au paramètre origin . |
Retourne
Il renvoie l’objet rééchantillonné.
Exemples de codes : DataFrame.resample()
Méthode pour rééchantillonner les données des séries sur une base hebdomadaire
import pandas as pd
index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)
series1= series.resample('W').sum()
print("The Resampled Data is: \n")
print(series1)
Production :
The Original Series is:
2021-01-01 0
2021-01-02 1
2021-01-03 2
2021-01-04 3
2021-01-05 4
2021-01-06 5
2021-01-07 6
2021-01-08 7
2021-01-09 8
2021-01-10 9
2021-01-11 10
2021-01-12 11
2021-01-13 12
2021-01-14 13
2021-01-15 14
2021-01-16 15
2021-01-17 16
2021-01-18 17
2021-01-19 18
2021-01-20 19
2021-01-21 20
2021-01-22 21
2021-01-23 22
2021-01-24 23
2021-01-25 24
2021-01-26 25
2021-01-27 26
2021-01-28 27
2021-01-29 28
2021-01-30 29
Freq: D, dtype: int64
The Resampled Data is:
2021-01-03 3
2021-01-10 42
2021-01-17 91
2021-01-24 140
2021-01-31 159
Freq: W-SUN, dtype: int64
La fonction a renvoyé la somme rééchantillonnée sur une base hebdomadaire.
Exemples de codes : DataFrame.resample()
Méthode pour rééchantillonner les données des séries sur une base mensuelle
import pandas as pd
index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)
series1= series.resample('M').sum()
print("The Resampled Data is: \n")
print(series1)
Production :
The Original Series is:
2021-01-01 0
2021-01-02 1
2021-01-03 2
2021-01-04 3
2021-01-05 4
2021-01-06 5
2021-01-07 6
2021-01-08 7
2021-01-09 8
2021-01-10 9
2021-01-11 10
2021-01-12 11
2021-01-13 12
2021-01-14 13
2021-01-15 14
2021-01-16 15
2021-01-17 16
2021-01-18 17
2021-01-19 18
2021-01-20 19
2021-01-21 20
2021-01-22 21
2021-01-23 22
2021-01-24 23
2021-01-25 24
2021-01-26 25
2021-01-27 26
2021-01-28 27
2021-01-29 28
2021-01-30 29
Freq: D, dtype: int64
The Resampled Data is:
2021-01-31 435
Freq: M, dtype: int64
La fonction a renvoyé la somme rééchantillonnée sur une base mensuelle.