Wie man Daten aus einer Textdatei in Pandas lädt
-
read_csv()
Methode zum Laden von Daten aus einer Textdatei -
read_fwf()
Methode zum Laden einer Textdatei im Breitenformat in PandasDataFrame
-
read_table()
Methode zum Laden einer Textdatei in PandasDataFrame
Wir werden die Methoden zum Laden der Daten aus einer txt
Datei mit Pandas DataFrame
vorstellen. Wir werden auch die verfügbaren Optionen durchgehen.
Zuerst werden wir eine einfache Textdatei namens sample.txt
erstellen und der Datei die folgenden Zeilen hinzufügen:
45 apple orange banana mango
12 orange kiwi onion tomato
Wir müssen sie im gleichen Verzeichnis speichern, in dem das Python-Skript ausgeführt wird.
read_csv()
Methode zum Laden von Daten aus einer Textdatei
read_csv()
ist der beste Weg, eine text
-Datei in Pandas DataFrame
zu konvertieren. Wir müssen header=None
setzen, da wir keine header
in der oben erstellten Datei haben. Wir können auch keep_default_na=False
innerhalb der Methode setzen, wenn wir leere Werte durch NaN
ersetzen wollen.
Beispiel-Codes:
# python 3.x
import pandas as pd
df = pd.read_csv("sample.txt", sep=" ", header=None)
print(df)
Ausgabe:
0 1 2 3 4
0 45 apple orange banana mango
1 12 orange kiwi onion tomato
Wir setzen sep=" "
, weil die Werte durch ein einzelnes Leerzeichen getrennt sind. In ähnlicher Weise können wir sep=","
setzen, wenn wir Daten aus einer durch Komma getrennten Datei lesen. Ersetzen Sie die Leerzeichen in sample.txt
durch ,
und lassen Sie den Code laufen, nachdem Sie sep=" "
durch sep=","
ersetzt haben.
Beispiel.txt
45,apple,orange,banana,mango
12,orange,kiwi,,tomato
Kodex:
# python 3.x
import pandas as pd
df = pd.read_csv("sample.txt", sep=",", header=None)
print(df)
Ausgabe:
0 1 2 3 4
0 45 apple orange banana mango
1 12 orange kiwi NaN tomato
read_fwf()
Methode zum Laden einer Textdatei im Breitenformat in Pandas DataFrame
read_fwf()
ist sehr hilfreich, um eine in der Breite formatierte Textdatei zu laden. Wir können sep
nicht benutzen, weil unterschiedliche Werte unterschiedliche Trennzeichen haben können. Betrachten Sie die folgende Textdatei:
Beispiel.txt
45 apple orange banana mango
12 orange kiwi onion tomato
In Beispiel.text
ist der Begrenzer
nicht für alle Werte gleich. Daher wird read_fwf()
hier die Arbeit erledigen.
Code:
# python 3.x
import pandas as pd
df = pd.read_fwf("sample.txt", header=None)
print(df)
Ausgabe:
0 1 2 3 4
0 45 apple orange banana mango
1 12 orange kiwi onion tomato
read_table()
Methode zum Laden einer Textdatei in Pandas DataFrame
read_table()
ist ein anderer Ansatz, um Daten aus einer Textdatei
in Pandas DataFrame
zu laden
.
Beispiel.txt:
45 apple orange banana mango
12 orange kiwi onion tomato
Der Code:
# python 3.x
import pandas as pd
df = pd.read_table("sample.txt", header=None, sep=" ")
print(df)
Ausgabe:
0 1 2 3 4
0 45 apple orange banana mango
1 12 orange kiwi onion tomato