Cómo extraer mes y año por separado de la columna Fecha y hora en Pandas

Suraj Joshi 30 enero 2023
  1. pandas.Series.dt.year() y pandas.Series.dt.month() métodos para extraer mes y año
  2. Método strftime() para extraer año y mes
  3. pandas.DatetimeIndex.month y pandas.DatetimeIndex.year para extraer año y mes
Cómo extraer mes y año por separado de la columna Fecha y hora en Pandas

Podríamos extraer año y mes de la columna Datetime usando los métodos pandas.Series.dt.year() y pandas.Series.dt.month() respectivamente. Si los datos no están en el tipo Datey hora, primero debemos convertirlos en Datey hora. También podemos extraer el año y el mes usando pandas.DatetimeIndex.month junto con el método pandas.DatetimeIndex.year y strftime().

pandas.Series.dt.year() y pandas.Series.dt.month() métodos para extraer mes y año

Los métodos pandas.Series.dt.year() y pandas.Series.dt.month() aplicados al tipo Datetime devuelven el array NumPy del año y el mes respectivamente de la entrada Datetime en el objeto Series.

import pandas as pd
import numpy as np
import datetime

list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)

df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)

Producción :

        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

Sin embargo, si la columna no es del tipo Datey hora, primero debemos convertir la columna al tipo Datey hora utilizando el método to_datetime().

import pandas as pd
import numpy as np
import datetime

list_of_dates = ["11/20/2019", "01/02/2020", "02/05/2020", "03/10/2020", "04/16/2020"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["Joined date"] = pd.to_datetime(df["Joined date"])

df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)

Producción :

        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

Método strftime() para extraer año y mes

El método strftime() toma Datetime toma códigos de formato como entrada y devuelve una cadena que representa el formato específico especificado en la salida. Utilizamos %Y y %m como códigos de formato para extraer año y mes.

import pandas as pd
import numpy as np
import datetime

list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)

df["year"] = df["Joined date"].dt.strftime("%Y")
df["month"] = df["Joined date"].dt.strftime("%m")

print(df)

Producción :

        Joined date  year month
Hisila   2019-11-20  2019    11
Shristi  2020-01-02  2020    01
Zeppy    2020-02-05  2020    02
Alina    2020-03-10  2020    03
Jerry    2020-04-16  2020    04

pandas.DatetimeIndex.month y pandas.DatetimeIndex.year para extraer año y mes

Otro enfoque simple para extraer el mes y el año de la columna Datey hora es recuperar los valores de los atributos de año y mes de los objetos de pandas.DatetimeIndex clase.

import pandas as pd
import numpy as np
import datetime

list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)

df["year"] = pd.DatetimeIndex(df["Joined date"]).year
df["month"] = pd.DatetimeIndex(df["Joined date"]).month

print(df)

Producción :

        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

La clase pandas.DatetimeIndex es un ndarray inmutable de datos datetime64. Tiene atributos como year, month, day, etc.

Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn