Estrai mese e anno separatamente dalla colonna Datetime in Pandas

Suraj Joshi 30 gennaio 2023
  1. Metodi pandas.Series.dt.year() e pandas.Series.dt.month() per estrarre mese e anno
  2. Metodo strftime() per estrarre anno e mese
  3. pandas.DatetimeIndex.month e pandas.DatetimeIndex.year per estrarre anno e mese
Estrai mese e anno separatamente dalla colonna Datetime in Pandas

Potremmo estrarre anno e mese dalla colonna Datetime usando i metodi pandas.Series.dt.year() e pandas.Series.dt.month() rispettivamente. Se i dati non sono nel tipo Datetime, dobbiamo prima convertirli in Datetime. Possiamo anche estrarre anno e mese usando pandas.DatetimeIndex.month insieme ai metodi pandas.DatetimeIndex.year e strftime().

Metodi pandas.Series.dt.year() e pandas.Series.dt.month() per estrarre mese e anno

I metodi pandas.Series.dt.year() e pandas.Series.dt.month() applicati al tipo Datetime restituiscono l’array NumPy dell’anno e del mese rispettivamente della voce Datetime nell’oggetto serie.

import pandas as pd
import numpy as np
import datetime

list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)

df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)

Produzione:

        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

Tuttavia, se la colonna non è di tipo Datetime, dobbiamo prima convertire la colonna in tipo Datetime utilizzando il metodo to_datetime().

import pandas as pd
import numpy as np
import datetime

list_of_dates = ["11/20/2019", "01/02/2020", "02/05/2020", "03/10/2020", "04/16/2020"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)
df["Joined date"] = pd.to_datetime(df["Joined date"])

df["Year"] = df["Joined date"].dt.year
df["Month"] = df["Joined date"].dt.month
print(df)

Produzione:

        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

Metodo strftime() per estrarre anno e mese

Il metodo strftime() accetta Datetime come input i codici di formato e restituisce una stringa che rappresenta il formato specifico specificato nell’output. Usiamo %Y e %m come codici di formato per estrarre anno e mese.

import pandas as pd
import numpy as np
import datetime

list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)

df["year"] = df["Joined date"].dt.strftime("%Y")
df["month"] = df["Joined date"].dt.strftime("%m")

print(df)

Produzione:

        Joined date  year month
Hisila   2019-11-20  2019    11
Shristi  2020-01-02  2020    01
Zeppy    2020-02-05  2020    02
Alina    2020-03-10  2020    03
Jerry    2020-04-16  2020    04

pandas.DatetimeIndex.month e pandas.DatetimeIndex.year per estrarre anno e mese

Un altro semplice approccio per estrarre il mese e l’anno dalla colonna Datetime consiste nel recuperare i valori degli attributi anno e mese degli oggetti della classe pandas.DatetimeIndex.

import pandas as pd
import numpy as np
import datetime

list_of_dates = ["2019-11-20", "2020-01-02", "2020-02-05", "2020-03-10", "2020-04-16"]
employees = ["Hisila", "Shristi", "Zeppy", "Alina", "Jerry"]
df = pd.DataFrame({"Joined date": pd.to_datetime(list_of_dates)}, index=employees)

df["year"] = pd.DatetimeIndex(df["Joined date"]).year
df["month"] = pd.DatetimeIndex(df["Joined date"]).month

print(df)

Produzione:

        Joined date  Year  Month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

La classe pandas.DatetimeIndex è un ndarray immutabile di dati datetime64. Ha attributi come year, month, day e così via.

Autore: Suraj Joshi
Suraj Joshi avatar Suraj Joshi avatar

Suraj Joshi is a backend software engineer at Matrice.ai.

LinkedIn