Como extrair mês e ano separadamente da coluna de data e hora em Pandas
-
pandas.Series.dt.year()
epandas.Series.dt.month()
Métodos para extrair mês e ano -
strftime()
Método de extração de ano e mês -
pandas.DatetimeIndex.month
epandas.DatetimeIndex.year
para extrair ano e mês
Podemos extrair ano e mês da coluna Datetime
utilizando os métodos pandas.Series.dt.year()
e pandas.Series.dt.month()
, respectivamente. Se os dados não estiverem no tipo Datetime
, precisamos convertê-los primeiramente para Datetime
. Também podemos extrair ano e mês utilizando o método pandas.DatetimeIndex.month
junto com o método pandas.DatetimeIndex.year
e strftime()
.
pandas.Series.dt.year()
e pandas.Series.dt.month()
Métodos para extrair mês e ano
Os métodos pandas.Series.dt.year()
e pandas.Series.dt.month()
aplicados em Datetime
retornam NumPy
array de ano e mês respectivamente da entrada Datetime
no objeto série.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)
Resultado:
Joined date Year Month
Hisila 2019-11-20 2019 11
Shristi 2020-01-02 2020 1
Zeppy 2020-02-05 2020 2
Alina 2020-03-10 2020 3
Jerry 2020-04-16 2020 4
Entretanto, se a coluna não for do tipo Datetime
, devemos primeiro converter a coluna para o tipo Datetime
utilizando o método to_datetime()
.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["11/20/2019", "01/02/2020", "02/05/2020", "03/10/2020", "04/16/2020"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["Joined date"] = pd.to_datetime(df["Joined date"])
df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)
Resultado:
Joined date Year Month
Hisila 2019-11-20 2019 11
Shristi 2020-01-02 2020 1
Zeppy 2020-02-05 2020 2
Alina 2020-03-10 2020 3
Jerry 2020-04-16 2020 4
strftime()
Método de extração de ano e mês
O método strftime()
toma os códigos de formato como entrada e retorna uma string representando o formato específico especificado na saída. Utilizamos %Y
e %m
como códigos de formato para extrair ano e mês.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["year"] = df["Joined date"].dt.strftime("%Y")
df["month"] = df["Joined date"].dt.strftime("%m")
print(df)
Resultado:
Joined date year month
Hisila 2019-11-20 2019 11
Shristi 2020-01-02 2020 01
Zeppy 2020-02-05 2020 02
Alina 2020-03-10 2020 03
Jerry 2020-04-16 2020 04
pandas.DatetimeIndex.month
e pandas.DatetimeIndex.year
para extrair ano e mês
Outra abordagem simples para extrair o mês e o ano da coluna Datatime
é recuperando valores de atributos de ano e mês de objetos da classe pandas.DatetimeIndex
.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["year"] = pd.DatetimeIndex(df["Joined date"]).year
df["month"] = pd.DatetimeIndex(df["Joined date"]).month
print(df)
Resultado:
Joined date Year Month
Hisila 2019-11-20 2019 11
Shristi 2020-01-02 2020 1
Zeppy 2020-02-05 2020 2
Alina 2020-03-10 2020 3
Jerry 2020-04-16 2020 4
A classe pandas.DatetimeIndex
é uma imutável ndarray de dados datetime64. Ela possui atributos como ano
, mês
, dia
, etc.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn