Lesen einer bestimmten Spalte aus einer .dat-Datei in Python
Wir haben einen riesigen Datenspeicher, der mehrere Daten in einer einzigen Datei enthält, wenn wir mit Big Data arbeiten. In vielen Fällen, in denen wir mit Big Data arbeiten, sind wir nicht an allen Spalten und Zeilen in dieser Datei interessiert. Wir benötigen nur bestimmte Zeilen und Spalten aus dieser Datei, um die Geschäftsanforderungen fortzusetzen. In diesem Artikel werden wir also Methoden kennenlernen, die als Extrahieren bestimmter Spalten oder Zeilen aus der .dat
-Datei bekannt sind. Es gibt jedoch verschiedene Möglichkeiten, dies in Python zu tun, und wir werden einige davon mit Beispielen unten sehen.
Wie wir bereits wissen, besteht die .dat-Datei aus generischen Daten zu jeder Domain. Die Datensätze bestehen aus beliebigen Arten von Informationen mit dem gleichen Datentyp. Diese Formate werden am besten verwendet, um Sätze oder Sequenzen von Datensätzen darzustellen, in denen jeder Datensatz eine identische Liste von Feldern hat.
Lesen einer bestimmten Spalte aus einer .dat
-Datei in Python
Nehmen wir an, wir haben eine .dat
-Datei mit den Aufzeichnungen der Preise, und wir möchten diese spezielle Spalte extrahieren und eine Analyse durchführen. Zuerst müssen wir die Datei .dat
mit der in Python eingebauten Funktion zum Öffnen von Dateien importieren. Dann extrahieren wir mit der Funktion split()
die erforderliche Spalte, indem wir sie innerhalb des Funktionsparameters split() übergeben. Es wird standardmäßig die gesamte Spalte für uns extrahieren. Dann werden wir mit der Funktion print()
in Python die gesamte Spalte auf dem Bildschirm anzeigen.
with open(r"airline.dat") as datFile:
print([data.split()[0] for data in datFile])
Ausgabe:
Year
1997
1999
1998
1996
Abdul is a software engineer with an architect background and a passion for full-stack web development with eight years of professional experience in analysis, design, development, implementation, performance tuning, and implementation of business applications.
LinkedIn