Imposta colonne come indice in Pandas Dataframe

Manav Narula 30 marzo 2021
  1. Usa set_index() per creare una colonna come indice in Pandas DataFrame
  2. Usa il parametro index_col in read_excel o read_csv per impostare la colonna come indice in Pandas DataFrame
Imposta colonne come indice in Pandas Dataframe

Di solito, in un Dataframe Pandas, abbiamo numeri di serie da 0 alla lunghezza dell’oggetto come indice per impostazione predefinita. Possiamo anche creare una colonna specifica di un dataframe come suo indice. Per questo, possiamo usare set_index() fornito in pandas, e possiamo anche specificare l’indice della colonna durante l’importazione di un dataframe da un file Excel o CSV.

Usa set_index() per creare una colonna come indice in Pandas DataFrame

set_index() può essere applicato a liste, serie o DataFrame per alterarne l’indice. Per i dataframe, set_index() può anche creare più colonne come loro indice.

Esempio:

import pandas as pd
import numpy as np

colnames = ["Name", "Time", "Course"]
df = pd.DataFrame(
    [["Jay", 10, "B.Tech"], ["Raj", 12, "BBA"], ["Jack", 11, "B.Sc"]], columns=colnames
)

print(df)

Produzione:

   Name  Time  Course
0   Jay    10  B.Tech
1   Raj    12     BBA
2  Jack    11    B.Sc

La sintassi per creare colonne come indice:

dataframe.set_index(Column_name, inplace=True)

Crea una singola colonna come indice utilizzando set_index():

import pandas as pd
import numpy as np

colnames = ["Name", "Time", "Course"]
df = pd.DataFrame(
    [["Jay", 10, "B.Tech"], ["Raj", 12, "BBA"], ["Jack", 11, "B.Sc"]], columns=colnames
)

df.set_index("Name", inplace=True)

print(df)

Produzione:

      Time  Course
Name              
Jay     10  B.Tech
Raj     12     BBA
Jack    11    B.Sc

Crea più colonne come indice:

import pandas as pd
import numpy as np

colnames = ["Name", "Time", "Course"]
df = pd.DataFrame(
    [["Jay", 10, "B.Tech"], ["Raj", 12, "BBA"], ["Jack", 11, "B.Sc"]], columns=colnames
)

df.set_index(["Name", "Course"], inplace=True)

print(df)

Produzione:

             Time
Name Course      
Jay  B.Tech    10
Raj  BBA       12
Jack B.Sc      11

Usa il parametro index_col in read_excel o read_csv per impostare la colonna come indice in Pandas DataFrame

Durante la lettura di un dataframe da un file Excel o CSV, possiamo specificare la colonna che vogliamo come indice del DataFrame.

Esempio:

import pandas as pd
import numpy as np

df = pd.read_excel("data.xlsx", index_col=2)
print(df)

Produzione:

        Name  Time
Course            
B.Tech  Mark    12
BBA     Jack    10
B.Sc     Jay    11
Autore: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

Articolo correlato - Pandas DataFrame