Pandas ermitteln die erste Zeile eines DataFrame
-
Die erste Zeile eines Pandas DataFrame mit der Eigenschaft
pandas.DataFrame.iloc
holen - Die erste Zeile aus einem Pandas DataFrame basierend auf einer spezifizierten Bedingung holen
Dieses Tutorial erklärt, wie wir die erste Zeile aus einem Pandas DataFrame mit Hilfe der Eigenschaft pandas.DataFrame.iloc
und der Methode pandas.DataFrame.head()
abrufen können.
Wir werden den DataFrame im folgenden Beispiel verwenden, um zu erklären, wie wir die erste Zeile aus einem Pandas DataFrame erhalten können.
import pandas as pd
df = pd.DataFrame(
{
"C_1": ["A", "B", "C", "D"],
"C_2": [40, 34, 38, 45],
"C_3": [430, 980, 200, 350],
}
)
print(df)
Ausgabe:
C_1 C_2 C_3
0 A 40 430
1 B 34 980
2 C 38 200
3 D 45 350
Die erste Zeile eines Pandas DataFrame mit der Eigenschaft pandas.DataFrame.iloc
holen
import pandas as pd
df = pd.DataFrame(
{
"C_1": ["A", "B", "C", "D"],
"C_2": [40, 34, 38, 45],
"C_3": [430, 980, 200, 350],
}
)
row_1 = df.iloc[0]
print("The DataFrame is:")
print(df, "\n")
print("The First Row of the DataFrame is:")
print(row_1)
Ausgabe:
The DataFrame is:
C_1 C_2 C_3
0 A 40 430
1 B 34 980
2 C 38 200
3 D 45 350
The First Row of the DataFrame is:
C_1 A
C_2 40
C_3 430
Name: 0, dtype: object
Es wird die erste Zeile des DataFrame df
angezeigt. Um die erste Zeile auszuwählen, verwenden wir den Standardindex der ersten Zeile, d.h. 0
mit der Eigenschaft iloc
des DataFrame.
Abrufen der ersten Zeile aus einem Pandas DataFrame mit der Methode pandas.DataFrame.head()
Die Methode pandas.DataFrame.head()
gibt einen DataFrame mit den obersten 5 Zeilen des DataFrame zurück. Wir können auch eine Zahl als Argument an die Methode pandas.DataFrame.head()
übergeben, die die Anzahl der obersten Zeilen angibt, die ausgewählt werden sollen. Wir können 1 als Argument an die Methode pandas.DataFrame.head()
übergeben, um nur die erste Zeile des DataFrame auszuwählen.
import pandas as pd
df = pd.DataFrame(
{
"C_1": ["A", "B", "C", "D"],
"C_2": [40, 34, 38, 45],
"C_3": [430, 980, 200, 350],
}
)
row_1 = df.head(1)
print("The DataFrame is:")
print(df, "\n")
print("The First Row of the DataFrame is:")
print(row_1)
Ausgabe:
The DataFrame is:
C_1 C_2 C_3
0 A 40 430
1 B 34 980
2 C 38 200
3 D 45 350
The First Row of the DataFrame is:
C_1 C_2 C_3
0 A 40 430
Die erste Zeile aus einem Pandas DataFrame basierend auf einer spezifizierten Bedingung holen
Um die erste Zeile, die bestimmte Bedingungen erfüllt, aus einem DataFrame zu extrahieren, filtern wir zunächst die Zeilen, die bestimmte Bedingungen erfüllen, und wählen dann die erste Zeile aus dem gefilterten DataFrame mit Hilfe der oben beschriebenen Methoden aus.
import pandas as pd
df = pd.DataFrame(
{
"C_1": ["A", "B", "C", "D"],
"C_2": [40, 34, 38, 45],
"C_3": [430, 980, 500, 350],
}
)
filtered_df = df[(df.C_2 < 40) & (df.C_3 > 450)]
row_1_filtered = filtered_df.head(1)
print("The DataFrame is:")
print(df, "\n")
print("The Filtered DataFrame is:")
print(filtered_df, "\n")
print("The First Row with C_2 less than 45 and C_3 greater than 450 is:")
print(row_1_filtered)
Ausgabe:
The DataFrame is:
C_1 C_2 C_3
0 A 40 430
1 B 34 980
2 C 38 500
3 D 45 350
The Filtered DataFrame is:
C_1 C_2 C_3
1 B 34 980
2 C 38 500
The First Row with C_2 less than 45 and C_3 greater than 450 is:
C_1 C_2 C_3
1 B 34 980
Es wird die erste Zeile angezeigt, bei der der Wert der Spalte C_2
kleiner als 45 und der Wert der Spalte C_3
größer als 450 ist.
Wir können auch die Methode query()
verwenden, um die Zeilen aus dem DataFrame zu filtern.
import pandas as pd
df = pd.DataFrame(
{
"C_1": ["A", "B", "C", "D"],
"C_2": [40, 34, 38, 45],
"C_3": [430, 980, 500, 350],
}
)
filtered_df = df.query("(C_2 < 40) & (C_3 > 450)")
row_1_filtered = filtered_df.head(1)
print("The DataFrame is:")
print(df, "\n")
print("The Filtered DataFrame is:")
print(filtered_df, "\n")
print("The First Row with C_2 less than 45 and C_3 greater than 450 is:")
print(row_1_filtered)
Ausgabe:
The DataFrame is:
C_1 C_2 C_3
0 A 40 430
1 B 34 980
2 C 38 500
3 D 45 350
The Filtered DataFrame is:
C_1 C_2 C_3
1 B 34 980
2 C 38 500
The First Row with C_2 less than 45 and C_3 greater than 450 is:
C_1 C_2 C_3
1 B 34 980
Es werden alle Zeilen mit dem Wert der Spalte C_2
kleiner als 45 und dem Wert der Spalte C_3
größer als 450 mit der Methode query()
gefiltert und dann die erste Zeile aus dem filtered_df
mit der Methode head()
ausgewählt.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedInVerwandter Artikel - Pandas DataFrame Row
- So erhalten Sie die Zeilenanzahl eines Pandas DataFrame
- Zufälliges Mischen von DataFrame-Zeilen in Pandas
- Wie man DataFrame-Zeilen auf der Grundlage von Spaltenwerten in Pandas filtert
- Wie man durch Zeilen eines DataFrame in Pandas iteriert
- Wie erhält man einen Index aller Reihen, deren bestimmte Spalte den gegebenen Zustand in Pandas befriedigt
- Finden Sie doppelte Zeilen in einem DataFrame mit Pandas