計算 Pandas 中的滾動相關值

Preet Sanghavi 2022年5月16日
計算 Pandas 中的滾動相關值

本教程將討論如何在 Pandas 中查詢滾動相關值。

在 Pandas 中計算滾動相關值的步驟

以下是計算 Pandas DataFrame 兩列之間滾動相關性的步驟。

進口 Pandas

我們需要從匯入 Pandas 庫開始。

import pandas as pd

建立一個 DataFrame

現在讓我們建立一個帶有兩列的示例 Pandas DataFrame,我們將在兩列之間計算滾動相關性。

data = {"Data1": [1, 4, 7, 10], "Data2": [2, 5, 8, 11]}
df = pd.DataFrame(data)

我們建立了一個名為 data 的字典,其中包含 Data1Data2 兩列,並將該字典傳遞給 pd.DataFrame() 函式以建立如下所示的 Pandas DataFrame。

print(df)

輸出:

   Data1  Data2
0      1      2
1      4      5
2      7      8
3     10     11

計算滾動相關性

我們將使用 Pandas 中的 rolling() 函式滾動我們的第一列,然後使用 corr() 函式計算滾動列與 DataFrame 中另一列的相關性。

rc = df["Data1"].rolling(2).corr(df["Data2"])

我們通過兩個觀察值的視窗長度將第一列滾動 2 並將其與第二列相關聯。我們將相關值儲存在一個新變數中。

現在讓我們列印新變數以檢視兩列之間滾動相關性的值。

print(rc)

輸出:

0    NaN
1    1.0
2    1.0
3    1.0

上面的輸出顯示了 DataFrame 中兩列之間的滾動相關值。因此,我們可以使用上述技術成功地確定 Pandas 中兩個 DataFrame 列之間所需的滾動相關值。

作者: Preet Sanghavi
Preet Sanghavi avatar Preet Sanghavi avatar

Preet writes his thoughts about programming in a simplified manner to help others learn better. With thorough research, his articles offer descriptive and easy to understand solutions.

LinkedIn GitHub

相關文章 - Pandas DataFrame