计算 Pandas 中的滚动相关值

Preet Sanghavi 2022年5月16日
计算 Pandas 中的滚动相关值

本教程将讨论如何在 Pandas 中查找滚动相关值。

在 Pandas 中计算滚动相关值的步骤

以下是计算 Pandas DataFrame 两列之间滚动相关性的步骤。

进口 Pandas

我们需要从导入 Pandas 库开始。

import pandas as pd

创建一个 DataFrame

现在让我们创建一个带有两列的示例 Pandas DataFrame,我们将在两列之间计算滚动相关性。

data = {"Data1": [1, 4, 7, 10], "Data2": [2, 5, 8, 11]}
df = pd.DataFrame(data)

我们创建了一个名为 data 的字典,其中包含 Data1Data2 两列,并将该字典传递给 pd.DataFrame() 函数以创建如下所示的 Pandas DataFrame。

print(df)

输出:

   Data1  Data2
0      1      2
1      4      5
2      7      8
3     10     11

计算滚动相关性

我们将使用 Pandas 中的 rolling() 函数滚动我们的第一列,然后使用 corr() 函数计算滚动列与 DataFrame 中另一列的相关性。

rc = df["Data1"].rolling(2).corr(df["Data2"])

我们通过两个观察值的窗口长度将第一列滚动 2 并将其与第二列相关联。我们将相关值存储在一个新变量中。

现在让我们打印新变量以查看两列之间滚动相关性的值。

print(rc)

输出:

0    NaN
1    1.0
2    1.0
3    1.0

上面的输出显示了 DataFrame 中两列之间的滚动相关值。因此,我们可以使用上述技术成功地确定 Pandas 中两个 DataFrame 列之间所需的滚动相关值。

作者: Preet Sanghavi
Preet Sanghavi avatar Preet Sanghavi avatar

Preet writes his thoughts about programming in a simplified manner to help others learn better. With thorough research, his articles offer descriptive and easy to understand solutions.

LinkedIn GitHub

相关文章 - Pandas DataFrame