Spalten als Index in Pandas Dataframe setzen

  1. Verwendung von set_index(), um eine Spalte als Index in einem Pandas DataFrame festzulegen
  2. Verwendung des Parameters index_col in read_excel oder read_csv, um eine Spalte als Index in Pandas DataFrame zu setzen
Spalten als Index in Pandas Dataframe setzen

Normalerweise haben wir in einem Pandas DataFrame standardmäßig fortlaufende Nummern von 0 bis zur Länge des Objekts als Index. Wir können auch eine bestimmte Spalte eines Dataframes als seinen Index festlegen. Dazu können wir die in Pandas bereitgestellte Funktion set_index() verwenden, und wir können den Spaltenindex auch beim Importieren eines Dataframes aus einer Excel- oder CSV-Datei angeben.

Verwendung von set_index(), um eine Spalte als Index in einem Pandas DataFrame festzulegen

set_index() kann auf Listen, Serien oder Dataframes angewendet werden, um deren Index zu ändern. Bei Dataframes kann set_index() auch mehrere Spalten als deren Index festlegen.

Beispiel:

import pandas as pd
import numpy as np

colnames = ["Name", "Time", "Course"]
df = pd.DataFrame(
    [["Jay", 10, "B.Tech"], ["Raj", 12, "BBA"], ["Jack", 11, "B.Sc"]], columns=colnames
)

print(df)

Ausgabe:

   Name  Time  Course
0   Jay    10  B.Tech
1   Raj    12     BBA
2  Jack    11    B.Sc

Die Syntax, um Spalten als Index zu machen:

dataframe.set_index(Column_name, inplace=True)

Eine einzelne Spalte mit set_index() als Index machen:

import pandas as pd
import numpy as np

colnames = ["Name", "Time", "Course"]
df = pd.DataFrame(
    [["Jay", 10, "B.Tech"], ["Raj", 12, "BBA"], ["Jack", 11, "B.Sc"]], columns=colnames
)

df.set_index("Name", inplace=True)

print(df)

Ausgabe:

      Time  Course
Name              
Jay     10  B.Tech
Raj     12     BBA
Jack    11    B.Sc

Mehrere Spalten als Index machen:

import pandas as pd
import numpy as np

colnames = ["Name", "Time", "Course"]
df = pd.DataFrame(
    [["Jay", 10, "B.Tech"], ["Raj", 12, "BBA"], ["Jack", 11, "B.Sc"]], columns=colnames
)

df.set_index(["Name", "Course"], inplace=True)

print(df)

Ausgabe:

             Time
Name Course      
Jay  B.Tech    10
Raj  BBA       12
Jack B.Sc      11

Verwendung des Parameters index_col in read_excel oder read_csv, um eine Spalte als Index in Pandas DataFrame zu setzen

Beim Lesen eines DataFrames aus einer Excel- oder CSV-Datei können wir die Spalte angeben, die wir als Index des DataFrames haben wollen.

Beispiel:

import pandas as pd
import numpy as np

df = pd.read_excel("data.xlsx", index_col=2)
print(df)

Ausgabe:

        Name  Time
Course            
B.Tech  Mark    12
BBA     Jack    10
B.Sc     Jay    11
Genießen Sie unsere Tutorials? Abonnieren Sie DelftStack auf YouTube, um uns bei der Erstellung weiterer hochwertiger Videoanleitungen zu unterstützen. Abonnieren
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

Verwandter Artikel - Pandas DataFrame