Wie man Daten aus einer Textdatei in Pandas lädt

Asad Riaz 25 Juni 2020
  1. read_csv() Methode zum Laden von Daten aus einer Textdatei
  2. read_fwf() Methode zum Laden einer Textdatei im Breitenformat in Pandas DataFrame
  3. read_table() Methode zum Laden einer Textdatei in Pandas DataFrame
Wie man Daten aus einer Textdatei in Pandas lädt

Wir werden die Methoden zum Laden der Daten aus einer txt Datei mit Pandas DataFrame vorstellen. Wir werden auch die verfügbaren Optionen durchgehen.

Zuerst werden wir eine einfache Textdatei namens sample.txt erstellen und der Datei die folgenden Zeilen hinzufügen:

45 apple orange banana mango
12 orange kiwi onion tomato

Wir müssen sie im gleichen Verzeichnis speichern, in dem das Python-Skript ausgeführt wird.

read_csv() Methode zum Laden von Daten aus einer Textdatei

read_csv() ist der beste Weg, eine text-Datei in Pandas DataFrame zu konvertieren. Wir müssen header=None setzen, da wir keine header in der oben erstellten Datei haben. Wir können auch keep_default_na=False innerhalb der Methode setzen, wenn wir leere Werte durch NaN ersetzen wollen.

Beispiel-Codes:

# python 3.x
import pandas as pd

df = pd.read_csv("sample.txt", sep=" ", header=None)
print(df)

Ausgabe:

    0       1       2       3       4
0  45   apple  orange  banana   mango
1  12  orange    kiwi   onion  tomato

Wir setzen sep=" ", weil die Werte durch ein einzelnes Leerzeichen getrennt sind. In ähnlicher Weise können wir sep="," setzen, wenn wir Daten aus einer durch Komma getrennten Datei lesen. Ersetzen Sie die Leerzeichen in sample.txt durch , und lassen Sie den Code laufen, nachdem Sie sep=" " durch sep="," ersetzt haben.

Beispiel.txt

45,apple,orange,banana,mango
12,orange,kiwi,,tomato

Kodex:

# python 3.x
import pandas as pd

df = pd.read_csv("sample.txt", sep=",", header=None)
print(df)

Ausgabe:

    0       1       2       3       4
0  45   apple  orange  banana   mango
1  12  orange    kiwi     NaN  tomato

read_fwf() Methode zum Laden einer Textdatei im Breitenformat in Pandas DataFrame

read_fwf() ist sehr hilfreich, um eine in der Breite formatierte Textdatei zu laden. Wir können sep nicht benutzen, weil unterschiedliche Werte unterschiedliche Trennzeichen haben können. Betrachten Sie die folgende Textdatei:

Beispiel.txt

45 apple  orange banana mango
12 orange kiwi   onion  tomato

In Beispiel.text ist der Begrenzer nicht für alle Werte gleich. Daher wird read_fwf() hier die Arbeit erledigen.

Code:

# python 3.x
import pandas as pd

df = pd.read_fwf("sample.txt", header=None)
print(df)

Ausgabe:

    0       1       2       3       4
0  45   apple  orange  banana   mango
1  12  orange    kiwi   onion  tomato

read_table() Methode zum Laden einer Textdatei in Pandas DataFrame

read_table() ist ein anderer Ansatz, um Daten aus einer Textdatei in Pandas DataFrame zu laden.

Beispiel.txt:

45 apple orange banana mango
12 orange kiwi onion tomato

Der Code:

# python 3.x
import pandas as pd

df = pd.read_table("sample.txt", header=None, sep=" ")
print(df)

Ausgabe:

    0       1       2       3       4
0  45   apple  orange  banana   mango
1  12  orange    kiwi   onion  tomato