Pandas DataFrame-Spalten auswählen
- Spalten aus einem Pandas DataFrame mittels Indizierungsoperation auswählen
-
Spalten aus einem Pandas DataFrame mit der Methode
DataFrame.drop()
auswählen -
Spalten aus einem Pandas DataFrame mit der Methode
DataFrame.filter()
auswählen
Dieses Tutorial erklärt, wie wir Spalten aus einem Pandas DataFrame durch Indizierung oder mit Hilfe der Methoden DataFrame.drop()
und DataFrame.filter()
auswählen können.
Wir werden den DataFrame df
wie unten beschrieben verwenden, um zu erklären, wie wir Spalten aus einem Pandas DataFrame auswählen können.
import pandas as pd
df = pd.DataFrame(
{
"A": [302, 504, 708, 103, 343, 565],
"B": [100, 300, 400, 200, 400, 700],
"C": [300, 400, 350, 100, 1000, 400],
"D": [10, 15, 5, 0, 2, 7],
"E": [4, 5, 6, 7, 8, 9],
}
)
print(df)
Ausgabe:
A B C D E
0 302 100 300 10 4
1 504 300 400 15 5
2 708 400 350 5 6
3 103 200 100 0 7
4 343 400 1000 2 8
5 565 700 400 7 9
Spalten aus einem Pandas DataFrame mittels Indizierungsoperation auswählen
import pandas as pd
df = pd.DataFrame(
{
"A": [302, 504, 708, 103, 343, 565],
"B": [100, 300, 400, 200, 400, 700],
"C": [300, 400, 350, 100, 1000, 400],
"D": [10, 15, 5, 0, 2, 7],
"E": [4, 5, 6, 7, 8, 9],
}
)
derived_df = df[["A", "C", "E"]]
print("The initial DataFrame is:")
print(df, "\n")
print("The DataFrame with A,C and E columns is:")
print(derived_df, "\n")
Ausgabe:
The initial DataFrame is:
A B C D E
0 302 100 300 10 4
1 504 300 400 15 5
2 708 400 350 5 6
3 103 200 100 0 7
4 343 400 1000 2 8
5 565 700 400 7 9
The DataFrame with A,C and E columns is:
A C E
0 302 300 4
1 504 400 5
2 708 350 6
3 103 100 7
4 343 1000 8
5 565 400 9
Es werden die Spalten A
, C
und E
aus dem DataFrame df
ausgewählt und diese Spalten dem DataFrame derived_df
zugewiesen.
Spalten aus einem Pandas DataFrame mit der Methode DataFrame.drop()
auswählen
import pandas as pd
df = pd.DataFrame(
{
"A": [302, 504, 708, 103, 343, 565],
"B": [100, 300, 400, 200, 400, 700],
"C": [300, 400, 350, 100, 1000, 400],
"D": [10, 15, 5, 0, 2, 7],
"E": [4, 5, 6, 7, 8, 9],
}
)
derived_df = df.drop(["B", "D"], axis=1)
print("The initial DataFrame is:")
print(df, "\n")
print("The DataFrame with A,C and E columns is:")
print(derived_df, "\n")
Ausgabe:
The initial DataFrame is:
A B C D E
0 302 100 300 10 4
1 504 300 400 15 5
2 708 400 350 5 6
3 103 200 100 0 7
4 343 400 1000 2 8
5 565 700 400 7 9
The DataFrame with A,C and E columns is:
A C E
0 302 300 4
1 504 400 5
2 708 350 6
3 103 100 7
4 343 1000 8
5 565 400 9
Sie lässt die Spalten B
und D
aus dem DataFrame df
fallen und ordnet die verbleibenden Spalten dem derived_df
zu. Alternativ wählt sie alle Spalten außer B
und D
aus und weist sie dem DataFrame derived_df
zu.
Spalten aus einem Pandas DataFrame mit der Methode DataFrame.filter()
auswählen
import pandas as pd
df = pd.DataFrame(
{
"A": [302, 504, 708, 103, 343, 565],
"B": [100, 300, 400, 200, 400, 700],
"C": [300, 400, 350, 100, 1000, 400],
"D": [10, 15, 5, 0, 2, 7],
"E": [4, 5, 6, 7, 8, 9],
}
)
derived_df = df.filter(["A", "C", "E"])
print("The initial DataFrame is:")
print(df, "\n")
print("The DataFrame with A,C and E columns is:")
print(derived_df, "\n")
Ausgabe:
The initial DataFrame is:
A B C D E
0 302 100 300 10 4
1 504 300 400 15 5
2 708 400 350 5 6
3 103 200 100 0 7
4 343 400 1000 2 8
5 565 700 400 7 9
The DataFrame with A,C and E columns is:
A C E
0 302 300 4
1 504 400 5
2 708 350 6
3 103 100 7
4 343 1000 8
5 565 400 9
Es werden die Spalten A
, C
und E
aus dem DataFrame df
extrahiert bzw. gefiltert und dem DataFrame derived_df
zugewiesen.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedInVerwandter Artikel - Pandas DataFrame Column
- Wie man Pandas DataFrame-Spaltenüberschriften als Liste erhält
- Pandas DataFrame-Spalte löschen
- Wie man DataFrame-Spalte in Datetime in Pandas konvertiert
- So erhalten Sie die Summe der Pandas-Spalte
- Wie man die Reihenfolge der Pandas DataFrame-Spalten ändert
- Wie man eine DataFrame-Spalte in eine Zeichenkette in Pandas konvertiert