Cómo extraer mes y año por separado de la columna Fecha y hora en Pandas
- 
          
            
pandas.Series.dt.year()ypandas.Series.dt.month()métodos para extraer mes y año - 
          
            Método 
strftime()para extraer año y mes - 
          
            
pandas.DatetimeIndex.monthypandas.DatetimeIndex.yearpara extraer año y mes 
Podríamos extraer año y mes de la columna Datetime usando los métodos pandas.Series.dt.year() y pandas.Series.dt.month() respectivamente. Si los datos no están en el tipo Datey hora, primero debemos convertirlos en Datey hora. También podemos extraer el año y el mes usando pandas.DatetimeIndex.month junto con el método pandas.DatetimeIndex.year y strftime().
pandas.Series.dt.year() y pandas.Series.dt.month() métodos para extraer mes y año
    
Los métodos pandas.Series.dt.year() y pandas.Series.dt.month() aplicados al tipo Datetime devuelven el array NumPy del año y el mes respectivamente de la entrada Datetime en el objeto Series.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)
Producción :
        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4
Sin embargo, si la columna no es del tipo Datey hora, primero debemos convertir la columna al tipo Datey hora utilizando el método to_datetime().
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["11/20/2019", "01/02/2020", "02/05/2020", "03/10/2020", "04/16/2020"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["Joined date"] = pd.to_datetime(df["Joined date"])
df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)
Producción :
        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4
Método strftime() para extraer año y mes
El método strftime() toma Datetime toma códigos de formato como entrada y devuelve una cadena que representa el formato específico especificado en la salida. Utilizamos %Y y %m como códigos de formato para extraer año y mes.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["year"] = df["Joined date"].dt.strftime("%Y")
df["month"] = df["Joined date"].dt.strftime("%m")
print(df)
Producción :
        Joined date  year month
Hisila   2019-11-20  2019    11
Shristi  2020-01-02  2020    01
Zeppy    2020-02-05  2020    02
Alina    2020-03-10  2020    03
Jerry    2020-04-16  2020    04
pandas.DatetimeIndex.month y pandas.DatetimeIndex.year para extraer año y mes
Otro enfoque simple para extraer el mes y el año de la columna Datey hora es recuperar los valores de los atributos de año y mes de los objetos de pandas.DatetimeIndex clase.
import pandas as pd
import numpy as np
import datetime
list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["year"] = pd.DatetimeIndex(df["Joined date"]).year
df["month"] = pd.DatetimeIndex(df["Joined date"]).month
print(df)
Producción :
        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4
La clase pandas.DatetimeIndex es un ndarray inmutable de datos datetime64. Tiene atributos como year, month, day, etc.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn