计算 Pandas 中两个 DataFrame 之间的交叉连接
Preet Sanghavi
2022年5月16日
在下面的教程中,我们将讨论如何在两个 Pandas DataFrame 之间执行交叉连接。
在 Pandas 中计算两个 DataFrame 之间的交叉连接的步骤
以下是在 Pandas 中计算两个 DataFrame 之间的交叉连接的步骤。
导入 Pandas
我们将导入 Pandas 库以执行交叉连接以开始使用。
import pandas as pd
创建 Pandas DataFrame
我们现在将创建两个示例 DataFrame 来执行交叉连接操作。这两个 DataFrame 将分别包含字母和数字。
data1 = {"A": ["a", "b"]}
data2 = {"B": [1, 2, 3]}
df = pd.DataFrame(data1, index=[0, 1])
df1 = pd.DataFrame(data2, index=[2, 3, 4])
计算 Pandas 中两个 DataFrame 之间的交叉连接
要在两个创建的示例 DataFrame 之间执行交叉连接,我们需要在两个 DataFrame 中创建一个键列以在同一键列上合并。
df["key"] = 2
df1["key"] = 2
我们将合并新 key
列上的两个 DataFrame 并删除 key
列以执行交叉连接。
res = pd.merge(df, df1, on="key").drop("key", axis=1)
现在,打印 res
变量以查看我们两个 DataFrame 之间的交叉连接结果。
输出:
A B
0 a 1
1 a 2
2 a 3
3 b 1
4 b 2
5 b 3
我们可以在输出中看到两个样本 DataFrame 之间的交叉连接。因此,我们可以使用上述技术成功计算 Pandas 中两个 DataFrame 之间的交叉连接。
作者: Preet Sanghavi