计算 Pandas 中的滚动相关值
Preet Sanghavi
2022年5月16日
本教程将讨论如何在 Pandas 中查找滚动相关值。
在 Pandas 中计算滚动相关值的步骤
以下是计算 Pandas DataFrame 两列之间滚动相关性的步骤。
进口 Pandas
我们需要从导入 Pandas 库开始。
import pandas as pd
创建一个 DataFrame
现在让我们创建一个带有两列的示例 Pandas DataFrame,我们将在两列之间计算滚动相关性。
data = {"Data1": [1, 4, 7, 10], "Data2": [2, 5, 8, 11]}
df = pd.DataFrame(data)
我们创建了一个名为 data
的字典,其中包含 Data1
和 Data2
两列,并将该字典传递给 pd.DataFrame()
函数以创建如下所示的 Pandas DataFrame。
print(df)
输出:
Data1 Data2
0 1 2
1 4 5
2 7 8
3 10 11
计算滚动相关性
我们将使用 Pandas 中的 rolling()
函数滚动我们的第一列,然后使用 corr()
函数计算滚动列与 DataFrame 中另一列的相关性。
rc = df["Data1"].rolling(2).corr(df["Data2"])
我们通过两个观察值的窗口长度将第一列滚动 2 并将其与第二列相关联。我们将相关值存储在一个新变量中。
现在让我们打印新变量以查看两列之间滚动相关性的值。
print(rc)
输出:
0 NaN
1 1.0
2 1.0
3 1.0
上面的输出显示了 DataFrame 中两列之间的滚动相关值。因此,我们可以使用上述技术成功地确定 Pandas 中两个 DataFrame 列之间所需的滚动相关值。
作者: Preet Sanghavi