Spalten als Index in Pandas Dataframe setzen
- 
          
            Verwendung von set_index(), um eine Spalte als Index in einem Pandas DataFrame festzulegen
- 
          
            Verwendung des Parameters index_colinread_exceloderread_csv, um eine Spalte als Index in Pandas DataFrame zu setzen
 
Normalerweise haben wir in einem Pandas DataFrame standardmäßig fortlaufende Nummern von 0 bis zur Länge des Objekts als Index. Wir können auch eine bestimmte Spalte eines Dataframes als seinen Index festlegen. Dazu können wir die in Pandas bereitgestellte Funktion set_index() verwenden, und wir können den Spaltenindex auch beim Importieren eines Dataframes aus einer Excel- oder CSV-Datei angeben.
Verwendung von set_index(), um eine Spalte als Index in einem Pandas DataFrame festzulegen
    
set_index() kann auf Listen, Serien oder Dataframes angewendet werden, um deren Index zu ändern. Bei Dataframes kann set_index() auch mehrere Spalten als deren Index festlegen.
Beispiel:
import pandas as pd
import numpy as np
colnames = ["Name", "Time", "Course"]
df = pd.DataFrame(
    [["Jay", 10, "B.Tech"], ["Raj", 12, "BBA"], ["Jack", 11, "B.Sc"]], columns=colnames
)
print(df)
Ausgabe:
   Name  Time  Course
0   Jay    10  B.Tech
1   Raj    12     BBA
2  Jack    11    B.Sc
Die Syntax, um Spalten als Index zu machen:
dataframe.set_index(Column_name, inplace=True)
Eine einzelne Spalte mit set_index() als Index machen:
import pandas as pd
import numpy as np
colnames = ["Name", "Time", "Course"]
df = pd.DataFrame(
    [["Jay", 10, "B.Tech"], ["Raj", 12, "BBA"], ["Jack", 11, "B.Sc"]], columns=colnames
)
df.set_index("Name", inplace=True)
print(df)
Ausgabe:
      Time  Course
Name              
Jay     10  B.Tech
Raj     12     BBA
Jack    11    B.Sc
Mehrere Spalten als Index machen:
import pandas as pd
import numpy as np
colnames = ["Name", "Time", "Course"]
df = pd.DataFrame(
    [["Jay", 10, "B.Tech"], ["Raj", 12, "BBA"], ["Jack", 11, "B.Sc"]], columns=colnames
)
df.set_index(["Name", "Course"], inplace=True)
print(df)
Ausgabe:
             Time
Name Course      
Jay  B.Tech    10
Raj  BBA       12
Jack B.Sc      11
Verwendung des Parameters index_col in read_excel oder read_csv, um eine Spalte als Index in Pandas DataFrame zu setzen
Beim Lesen eines DataFrames aus einer Excel- oder CSV-Datei können wir die Spalte angeben, die wir als Index des DataFrames haben wollen.
Beispiel:
import pandas as pd
import numpy as np
df = pd.read_excel("data.xlsx", index_col=2)
print(df)
Ausgabe:
        Name  Time
Course            
B.Tech  Mark    12
BBA     Jack    10
B.Sc     Jay    11
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedInVerwandter Artikel - Pandas DataFrame
- Wie man Pandas DataFrame-Spaltenüberschriften als Liste erhält
- Pandas DataFrame-Spalte löschen
- Wie man DataFrame-Spalte in Datetime in Pandas konvertiert
- Wie konvertiert man eine Fließkommazahl in eine Ganzzahl in Pandas DataFrame
- Wie man Pandas-DataFrame nach den Werten einer Spalte sortiert
- Wie erhält man das Aggregat der Pandas gruppenweise und sum
