Função Pandas DataFrame.resample()
Minahil Noor
30 janeiro 2023
-
Sintaxe de
pandas.DataFrame.resample()
: -
Códigos de exemplo: Método
DataFrame.resample()
para reamostrar os dados da série semanalmente -
Códigos de exemplo: Método
DataFrame.resample()
para reamostrar os dados da série com base mensal
A função Python Pandas DataFrame.resample()
faz uma nova amostra dos dados da série temporal.
Sintaxe de pandas.DataFrame.resample()
:
DataFrame.resample(
rule,
axis=0,
closed=None,
label=None,
convention="start",
kind=None,
loffset=None,
base=None,
on=None,
level=None,
origin="start_day",
offset=None,
)
Parâmetros
rule |
É a string de deslocamento ou objeto que representa a conversão de destino. |
axis |
Ele especifica qual eixo usar para aumentar ou diminuir a amostragem. Para Series, o padrão é 0, o que significa ao longo das linhas. |
closed |
Ele especifica qual lado do intervalo bin está fechado. Tem duas opções: right ou left . |
label |
Ele especifica o rótulo da borda da caixa para rotular o balde. Tem duas opções: right ou left . |
convention |
Possui quatro opções: start , end , s , ou e . Apenas para PeriodIndex, ele usa o start ou end da regra. |
kind |
Ele especifica o tipo de índice resultante. Possui duas opções: timestamp ou period . Timestamp converte o índice resultante em DateTimeIndex e period o converte em PeriodIndex. |
loffset |
Ele ajusta os rótulos de tempo reamostrados. |
base |
É um número inteiro. Seu valor padrão é 0. |
on |
Ele representa o nome da coluna a ser usada em vez do índice para reamostragem. A coluna deve ser semelhante a data e hora. |
level |
Ele representa o nome do nível a ser usado para reamostragem. O nível deve ser semelhante a data e hora. |
origin |
É o carimbo de data/hora para ajustar o agrupamento. Tem três opções: epoch , start ou start_day . |
offset |
Ele representa um deslocamento timedelta adicionado ao parâmetro origin . |
Retornar
Ele retorna o objeto reamostrado.
Códigos de exemplo: Método DataFrame.resample()
para reamostrar os dados da série semanalmente
import pandas as pd
index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)
series1= series.resample('W').sum()
print("The Resampled Data is: \n")
print(series1)
Resultado:
The Original Series is:
2021-01-01 0
2021-01-02 1
2021-01-03 2
2021-01-04 3
2021-01-05 4
2021-01-06 5
2021-01-07 6
2021-01-08 7
2021-01-09 8
2021-01-10 9
2021-01-11 10
2021-01-12 11
2021-01-13 12
2021-01-14 13
2021-01-15 14
2021-01-16 15
2021-01-17 16
2021-01-18 17
2021-01-19 18
2021-01-20 19
2021-01-21 20
2021-01-22 21
2021-01-23 22
2021-01-24 23
2021-01-25 24
2021-01-26 25
2021-01-27 26
2021-01-28 27
2021-01-29 28
2021-01-30 29
Freq: D, dtype: int64
The Resampled Data is:
2021-01-03 3
2021-01-10 42
2021-01-17 91
2021-01-24 140
2021-01-31 159
Freq: W-SUN, dtype: int64
A função retornou a soma reamostrada semanalmente.
Códigos de exemplo: Método DataFrame.resample()
para reamostrar os dados da série com base mensal
import pandas as pd
index = pd.date_range('1/1/2021', periods=30, freq='D')
series = pd.Series(range(30), index=index)
print("The Original Series is: \n")
print(series)
series1= series.resample('M').sum()
print("The Resampled Data is: \n")
print(series1)
Resultado:
The Original Series is:
2021-01-01 0
2021-01-02 1
2021-01-03 2
2021-01-04 3
2021-01-05 4
2021-01-06 5
2021-01-07 6
2021-01-08 7
2021-01-09 8
2021-01-10 9
2021-01-11 10
2021-01-12 11
2021-01-13 12
2021-01-14 13
2021-01-15 14
2021-01-16 15
2021-01-17 16
2021-01-18 17
2021-01-19 18
2021-01-20 19
2021-01-21 20
2021-01-22 21
2021-01-23 22
2021-01-24 23
2021-01-25 24
2021-01-26 25
2021-01-27 26
2021-01-28 27
2021-01-29 28
2021-01-30 29
Freq: D, dtype: int64
The Resampled Data is:
2021-01-31 435
Freq: M, dtype: int64
A função retornou a soma reamostrada mensalmente.