Verketten Sie zwei DataFrames in Pandas Python

Fariba Laiq 21 Juni 2023
  1. Verketten Sie zwei DataFrames in Pandas Python
  2. Verwenden Sie die Funktion concat(), um zwei DataFrames in Pandas Python zu verketten
  3. Kombinieren Sie zwei Pandas-DataFrames mithilfe eines gemeinsamen Felds
  4. Verwenden Sie die append()-Methode, um zwei DataFrames in Pandas Python zu verketten
Verketten Sie zwei DataFrames in Pandas Python

Serien, die eine listenartige Struktur haben, und Datenrahmen, die eine tabellarische Struktur haben, sind zwei neue Arten von Objekten zum Speichern von Daten, die von Pandas eingeführt wurden. Pandas-Datenrahmen gehören zu den nützlichsten Datenstrukturen in jedem Toolkit.

Sie können einen Datenrahmen als zweidimensionale beschriftete Datenstruktur betrachten, die Spalten enthält, die von mehreren Typen sein können, ähnlich einer SQL-Tabelle oder einem Diktat von Serienobjekten. Es ist oft das Element Pandas, das am meisten verwendet wird.

Verketten Sie zwei DataFrames in Pandas Python

Mit Hilfe von Pandas ist es möglich, Serien oder Datenrahmen schnell mit verschiedenen Arten von Satzlogik für die Indizes und relationale Algebra-Funktionen für Join- und Merge-Operationen zu kombinieren. Darüber hinaus bieten Pandas Tools zum Vergleichen zweier Serien oder Datenrahmen und zum Hervorheben ihrer Unterschiede mit der Pandas-Technik concat(); zwei oder mehr Datenrahmen können miteinander verbunden werden.

Die Pandas-Funktion concat() verbindet Datenrahmen über Zeilen oder Spalten hinweg. Wir können viele Datenrahmen kombinieren, indem wir sie entlang von Zeilen oder Spalten verketten.

Verwenden Sie die Funktion concat(), um zwei DataFrames in Pandas Python zu verketten

concat() ist eine Funktion in Pandas, die Spalten oder Zeilen von einem Datenrahmen an einen anderen anhängt. Es kombiniert Datenrahmen sowie Serien.

Im folgenden Code haben wir zwei Datenrahmen erstellt und mit der Funktion concat() kombiniert. Wir haben die beiden Datenframes als Liste an die Funktion concat() übergeben.

Beispielcode:

import pandas as pd

df1 = pd.DataFrame(
    {"id": ["ID1", "ID2", "ID3", "!D4"], "Names": ["Harry", "Petter", "Daniel", "Ron"]}
)
df2 = pd.DataFrame(
    {"id": ["ID5", "ID6", "ID7", "ID8"], "Names": ["Kelvin", "Henry", "Emma", "Sofia"]}
)
display(" First DataFrame: ", df1)
display(" Second DataFrame: ", df2)
frames = [df1, df2]
d = pd.concat(frames)
display(d)

Ausgang:

Pandas verketten zwei Datenrahmen mit Concat

Kombinieren Sie zwei Pandas-DataFrames mithilfe eines gemeinsamen Felds

Um sie zu verketten, haben wir unsere Datenrahmen entweder vertikal oder nebeneinander hinzugefügt. Die Verwendung von Spalten aus jedem Datensatz mit ähnlichen Werten ist eine weitere Methode zum Kombinieren von Datenrahmen (eine eindeutige gemeinsame ID).

Verbinden ist der Vorgang des Kombinierens von Datenrahmen unter Verwendung eines gemeinsam genutzten Felds. Der/die join-Schlüssel beziehen sich auf die gemeinsamen Wertespalten.

Wenn ein Datenrahmen eine Nachschlagetabelle enthält, die zusätzliche Daten enthält, die wir in den anderen integrieren möchten, ist das Verbinden von Datenrahmen auf diese Weise häufig hilfreich.

Wenn Sie mehrere Datenrahmen zusammenfügen, haben Sie die Möglichkeit, die verschiedenen Achsen zu handhaben (außer der, die verkettet wird).

Um Ihnen zu zeigen, wie dies verwendet werden kann, nehmen Sie die Vereinigung von allen, join='outer'. Betrachten Sie die Schnittmenge mit join='inner', da dies keinen Informationsverlust verursacht und die Standardauswahl ist.

Beispielcode:

import pandas as pd

df1 = pd.DataFrame(
    {"id": ["ID1", "ID2", "ID3", "!D4"], "Names": ["Harry", "Petter", "Daniel", "Ron"]}
)
df2 = pd.DataFrame(
    {"id": ["ID5", "ID6", "ID7", "ID8"], "Names": ["Kelvin", "Henry", "Emma", "Sofia"]}
)
print(" First DataFrame: ", df1)
print(" Second DataFrame: ", df2)
frames = [df1, df2]
d = pd.concat([df1, df2], axis=1, join="inner")
print(d)

Ausgang:

Pandas verketten zwei Datenrahmen mit einem gemeinsamen Feld

Verwenden Sie die append()-Methode, um zwei DataFrames in Pandas Python zu verketten

Die Methode append() kann verwendet werden, um Datenrahmen zu verketten, da append() eine nützliche Verknüpfungsinstanzmethode für Serien und Datenrahmen ist. Diese Technik existierte vor concat().

Beispielcode:

import pandas as pd
import pandas as pd

df1 = pd.DataFrame(
    {"id": ["ID1", "ID2", "ID3", "!D4"], "Names": ["Harry", "Petter", "Daniel", "Ron"]}
)

df2 = pd.DataFrame(
    {"id": ["ID5", "ID6", "ID7", "ID8"], "Names": ["Kelvin", "Henry", "Emma", "Sofia"]}
)
frames = [df1, df2]
d = pd.concat([df1, df2], axis=1, join="inner")
result = df1.append(df2)
display(result)

Ausgang:

Pandas verketten zwei Datenrahmen mit Append

Fariba Laiq avatar Fariba Laiq avatar

I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.

LinkedIn

Verwandter Artikel - Pandas DataFrame