Pandas lesen nur bestimmte CSV-Spalten
-
Verwenden Sie die Funktion
read_csv()
und übergeben Sie eine Liste der zu lesenden Spaltennamen -
Verwenden Sie die Funktion
read_csv()
und übergeben Sie die Liste der zu lesenden Spaltennummern
In diesem Tutorial werden verschiedene Methoden zum Lesen bestimmter Spalten aus einer CSV-Datei mit Pandas erläutert. Wir verwenden die folgende CSV-Datei für die Demo.
Kurs | Mentor | Preis $ |
|
---|---|---|---|
0 | Python | Robert | 199 |
1 | Funke | Elisabeth | 299 |
2 | Java | Nolan | 99 |
3 | JavaScript | Chris | 250 |
4 | C# | Johnson | 399 |
Verwenden Sie die Funktion read_csv()
und übergeben Sie eine Liste der zu lesenden Spaltennamen
Die Pandas-Bibliothek bietet die Funktion read_csv()
. Das read_csv()
wird verwendet, um eine Datei mit kommagetrennten Werten (csv) in DataFrame
einzulesen.
read_csv()
übernimmt den Dateipfad der csv-Datei und hat mehr als 40 optionale Parameter. Konzentrieren wir uns für dieses Tutorial auf den Parameter usecols
.
Syntax - pd.read_csv()
:
pd.read_csv(filepath, usecols)
Parameter
Dateipfad
– Der Pfad oder Speicherort der zu ladenden CSV-Datei.usecols
- Liste der zu lesenden spezifischen Spalten.
Kehrt zurück
DataFrame
Befolgen Sie die nachstehenden Schritte, um die Funktion read_csv()
zu verwenden und die Liste der zu lesenden Spaltennamen zu übergeben.
-
Pandas-Bibliothek importieren.
-
Übergeben Sie den Pfad der CSV-Datei und die Liste der zu lesenden Spalten an die Methode
read_csv()
. -
Die Methode
read_csv()
gibt einen Datenrahmen mit diesen spezifischen Spalten zurück. -
Drucken Sie den
DataFrame
.
Der folgende Code ist die Implementierung des obigen Ansatzes.
# import the pandas
import pandas as pd
# Reading the specific columns from csv
df = pd.read_csv("data.csv", usecols=["Course", "price$"])
# printing the dataframe
print(df)
Ausgang:
Course price$
0 Python 199
1 Spark 299
2 Java 99
3 JavaScript 250
4 C# 399
Verwenden Sie die Funktion read_csv()
und übergeben Sie die Liste der zu lesenden Spaltennummern
Wir können auch die Spaltennummern für read_csv()
verwenden, um bestimmte Spalten nur zu lesen.
-
Pandas-Bibliothek importieren.
-
Übergeben Sie den Pfad der CSV-Datei und die Liste der zu lesenden Spaltennummern an die Methode
read_csv()
. -
Die Methode
read_csv()
gibt einen Datenrahmen mit diesen spezifischen Spalten zurück. -
Drucken Sie den
DataFrame
.
Der folgende Code ist die Implementierung des obigen Ansatzes.
# import the pandas
import pandas as pd
# Reading the specific columns from csv
df = pd.read_csv("data.csv", usecols=[2, 3])
# printing the dataframe
print(df)
Ausgang:
Mentor price$
0 Robert 199
1 Elizibeth 299
2 Nolan 99
3 Chris 250
4 johnson 399
Verwandter Artikel - Pandas DataFrame
- Wie man Pandas DataFrame-Spaltenüberschriften als Liste erhält
- Pandas DataFrame-Spalte löschen
- Wie man DataFrame-Spalte in Datetime in Pandas konvertiert
- Wie konvertiert man eine Fließkommazahl in eine Ganzzahl in Pandas DataFrame
- Wie man Pandas-DataFrame nach den Werten einer Spalte sortiert
- Wie erhält man das Aggregat der Pandas gruppenweise und sum