計算 Pandas 中兩個 DataFrame 之間的交叉連線
Preet Sanghavi
2022年5月16日
在下面的教程中,我們將討論如何在兩個 Pandas DataFrame 之間執行交叉連線。
在 Pandas 中計算兩個 DataFrame 之間的交叉連線的步驟
以下是在 Pandas 中計算兩個 DataFrame 之間的交叉連線的步驟。
匯入 Pandas
我們將匯入 Pandas 庫以執行交叉連線以開始使用。
import pandas as pd
建立 Pandas DataFrame
我們現在將建立兩個示例 DataFrame 來執行交叉連線操作。這兩個 DataFrame 將分別包含字母和數字。
data1 = {"A": ["a", "b"]}
data2 = {"B": [1, 2, 3]}
df = pd.DataFrame(data1, index=[0, 1])
df1 = pd.DataFrame(data2, index=[2, 3, 4])
計算 Pandas 中兩個 DataFrame 之間的交叉連線
要在兩個建立的示例 DataFrame 之間執行交叉連線,我們需要在兩個 DataFrame 中建立一個鍵列以在同一鍵列上合併。
df["key"] = 2
df1["key"] = 2
我們將合併新 key
列上的兩個 DataFrame 並刪除 key
列以執行交叉連線。
res = pd.merge(df, df1, on="key").drop("key", axis=1)
現在,列印 res
變數以檢視我們兩個 DataFrame 之間的交叉連線結果。
輸出:
A B
0 a 1
1 a 2
2 a 3
3 b 1
4 b 2
5 b 3
我們可以在輸出中看到兩個樣本 DataFrame 之間的交叉連線。因此,我們可以使用上述技術成功計算 Pandas 中兩個 DataFrame 之間的交叉連線。
作者: Preet Sanghavi