Konvertieren Sie Liste in Pandas DataFrame in Python

Ankur Baral 16 Februar 2022
  1. Konvertieren Sie eine Liste in einen Pandas DataFrame in Python
  2. Speichern Sie die Liste in einer Spalte in Pandas DataFrame in Python
  3. Konvertieren einer Liste in einen DataFrame mit Index in Python
  4. Zip zwei Listen in einen einzelnen DataFrame mit zip() in Python
  5. Konvertieren einer mehrdimensionalen Liste in einen Pandas DataFrame in Python
Konvertieren Sie Liste in Pandas DataFrame in Python

In diesem Artikel werden Methoden zum Konvertieren von Elementen in einer Liste in einen Pandas DataFrame vorgestellt.

Konvertieren Sie eine Liste in einen Pandas DataFrame in Python

Der DataFrame ist im Allgemeinen eine zweidimensionale beschriftete Datenstruktur. Pandas ist ein Open-Source-Python-Paket, das für die Datenwissenschaft sehr nützlich ist.

Hier importieren wir zuerst das Pandas-Paket. Wir werden das Pandas-Paket in diesem speziellen Programm als pd definieren. Dann erstellen wir eine Liste my_list, um die Listenwerte Tom, Mark und Tony zu speichern, die nichts anderes als zufällige Namen sind. Dann weisen wir pd.DataFrame(my_list) einer Variablen df zu. Die Methode DataFrame(my_list) nimmt die Werte von my_list und erstellt daraus einen DataFrame. In der letzten Zeile unseres Programms haben wir den gedruckten DataFrame aufgerufen, den wir in der Variablen df gespeichert haben. Beachten Sie, dass wir anstelle von print(df) auch einfach df hätten schreiben können, um unseren DataFrame zu sehen.

Beispielcode:

# python 3.x
import pandas as pd

my_list = ["Tom", "Mark", "Tony"]
df = pd.DataFrame(my_list)
print(df)

Ausgabe:

    0
0   Tom
1   Mark
2   Tony

Wir können sehen, dass sich die Elemente, die wir in der Liste bereitgestellt haben, jetzt in einer Spalte in der obigen Ausgabe befinden.

Speichern Sie die Liste in einer Spalte in Pandas DataFrame in Python

Wir können eine Liste in den Pandas DataFrame konvertieren, indem wir eine Spalte im DataFrame erstellen und die konvertierten Daten in der Spalte speichern.

Um eine Liste in die Daten einer Pandas DataFrame-Spalte umzuwandeln, erstellen wir eine Liste my_list und geben der Liste einige zufällige Namen als Werte. Unser Ziel ist es, dass die Listenelemente zu den Einträgen einer Spalte mit dem Titel Names werden. Dazu übergeben wir die Variable my_list an pd.DataFrame() mit columns = ['Names'] wie unten. Dann geben wir die Variable df aus und führen unseren Code aus, um die Ausgabe zu sehen.

Beispielcode:

# python 3.x
import pandas as pd

my_list = ["Tom", "Mark", "Tony"]
df = pd.DataFrame(my_list, columns=["Names"])
print(df)

Ausgabe:

    Names
0   Tom
1   Mark
2   Tony

Nachdem wir ein zusätzliches Attribut columns = ['Names'] gesetzt haben, sehen wir, dass die Namen in my_list als Werte der Spalte Names im DataFrame übernommen wurden.

Konvertieren einer Liste in einen DataFrame mit Index in Python

Wir können die Listenelemente auch indizieren, während wir sie in einen DataFrame konvertieren.

Wir erstellen eine Liste my_list. Unser Ziel ist es sicherzustellen, dass die Listenelemente zu Spalteneinträgen mit dem Titel Names mit vordefinierten zeilenweisen Indizes werden. Dazu erstellen wir eine Liste index und füllen sie mit i, ii und iii. Wir können die Liste als zweiten Parameter in pd.DataFrame() verwenden. Der erste und der dritte Parameter sind my_list und columns =['Names']. Dann geben wir die Variable df aus, in der der von uns geschriebene Ausdruck gespeichert ist.

Beispielcode:

# python 3.x
import pandas as pd

my_list = [" Tom", "Mark", "Tony"]
df = pd.DataFrame(my_list, index=["i.", "ii.", "iii."], columns=["Names"])
print(df)

Ausgabe:

     Names
i.    Tom
ii.   Mark
iii.  Tony

Wir können sehen, dass die Werte in der Liste index die Standard-Pandas-Indizes ersetzt haben. Wir können jeden beliebigen Wert in den index eintragen und entsprechende Ergebnisse liefern.

Zip zwei Listen in einen einzelnen DataFrame mit zip() in Python

Die Funktion zip() kombiniert die Werte zweier verschiedener Listen zu einer, indem sie die Werte der Listen mit demselben Index gruppiert. Bevor wir einen DataFrame erstellen, schauen wir uns zuerst an, wie zip() funktioniert.

Beispielcode:

# python 3.x
a = ["1", "2", "3"]
b = ["4", "5", "6"]
c = zip(a, b)
list1 = list(c)
print(list1)

Ausgabe:

[('1', '4'), ('2', '5'), ('3', '6')]

Wir können sehen, dass die Funktion zip() uns geholfen hat, die Listen a und b mit ähnlichen gruppierten indizierten Elementen zu kombinieren. Wir haben den gezippten Status der Listen a und b auf c gespeichert und dann list1 erstellt und die gezippte Liste c darin gespeichert. Im folgenden Beispiel verwenden wir zip(), um einen Pandas DataFrame zu erstellen.

Wir werden zwei verschiedene Listen erstellen, name_list und height_list, und einige Namen bzw. Höhen speichern. Dann zippen wir name_list und height_list mit zip(name_list, height_list), um einen Pandas DataFrame zu erstellen.

Beachten Sie, dass wir unsere Daten auch indizieren können, indem wir einfach ein weiteres Attribut index = [ 'index1', 'index2', 'index3' ] setzen, wobei die Elemente in der Indexliste alles Mögliche sein können.

Beispielcode:

# python 3.x
import pandas as pd

name_list = ["Tom", "Mark", "Tony"]
height_list = ["150", "151", "152"]
df = pd.DataFrame((zip(name_list, height_list)), columns=["Name", "Height"])
print(df)

Ausgabe:

    Name    Height
0   Tom     150
1   Mark    151
2   Tony    152

Wir können sehen, dass der gebildete DataFrame aus Werten von name_list und height_list in der richtigen Reihenfolge besteht.

Wir können diese Technik auch verwenden, um mehr als zwei Listen zu zippen.

Konvertieren einer mehrdimensionalen Liste in einen Pandas DataFrame in Python

Wir können sogar die mehrdimensionale Liste in einen Pandas DataFrame konvertieren. Wir können die Spaltennamen für die Listenelemente in der mehrdimensionalen Liste festlegen. Wir demonstrieren diese Methode mit einer zweidimensionalen Liste.

Um eine mehrdimensionale Liste in einen Pandas-DataFrame zu konvertieren, müssen wir zuerst eine Liste mit mehreren Listen erstellen. Wir werden also zuerst Pandas importieren und dann eine Liste info erstellen, in der wir den Namen und das Alter von drei verschiedenen Personen in drei separaten Listen speichern. Dann rufen wir pd.DataFrame() auf und verarbeiten die Liste hinein und geben zwei Spaltentitel, Name und Age für unsere Daten an.

Beispielcode:

# python 3.x
import pandas as pd

info = [["Tom", 18], ["Mark", 25], ["Tony", 68]]
df = pd.DataFrame(info, columns=["Name", "Age"])
print(df)

Ausgabe:

    Name    Age
0   Tom     18
1   Mark    25
2   Tony    68

Wir haben zwei Spalten als Ausgabe mit den Namen und ihrem Alter in entsprechender Reihenfolge. Wir können den einzelnen Listen innerhalb von info weitere Werte hinzufügen und ihnen Spaltentitel geben, um mehr Spalten in unserem DataFrame zu erhalten.

Verwandter Artikel - Python List