在 Pandas 中执行 T 检验

Preet Sanghavi 2022年5月16日
在 Pandas 中执行 T 检验

本教程将讨论如何在 Pandas 中找到 T 检验值。

在 Pandas 中执行 T 检验的步骤

以下是在 Pandas 中执行 T 检验的步骤。

导入相关库

我们必须从 scipy.stats 导入 Pandas 库和 ttest_ind 才能开始。

import pandas as pd
from scipy.stats import ttest_ind

创建一个 Pandas DataFrame

让我们创建一个示例 DataFrame 来对同一 DataFrame 执行 T 检验操作。

data = {
    "Category": [
        "type2",
        "type1",
        "type2",
        "type1",
        "type2",
        "type1",
        "type2",
        "type1",
        "type1",
        "type1",
        "type2",
    ],
    "values": [1, 2, 3, 1, 2, 3, 1, 2, 3, 5, 1],
}
df = pd.DataFrame(data)

我们创建了一个 DataFrame,其中包含一个包含两种类别的类别列,并为每个类别实例分配了一个值。

让我们在下面查看我们的 DataFrame。

print(df)

输出:

   Category  values
0     type2       1
1     type1       2
2     type2       3
3     type1       1
4     type2       2
5     type1       3
6     type2       1
7     type1       2
8     type1       3
9     type1       5
10    type2       1

我们现在将使用以下代码为这两种类别类型创建一个单独的 DataFrame。此步骤有助于 T 检验查找过程。

type1 = my_data[my_data["Category"] == "type1"]
type2 = my_data[my_data["Category"] == "type2"]

在 Pandas 中获取 T 检验值

我们现在将找到 T 检验结果并使用 ttest_ind() 函数将它们存储在一个变量中。我们通过以下方式使用此功能。

res = ttest_ind(type1["values"], type2["values"])

在上面的代码中,我们将 DataFrame 作为参数传递给函数,我们得到了 T 检验结果,包括一个具有 t 统计量和 p 值的元组。

现在让我们打印 res 变量以查看结果。

print(res)

输出:

Ttest_indResult(statistic=1.4927289925706944, pvalue=0.16970867501294376)

在上面的输出中,我们找到了具有 t 统计量和 p 值的 T 检验值。因此,我们可以通过上述方法成功找到 Pandas 中的 T 检验值。

作者: Preet Sanghavi
Preet Sanghavi avatar Preet Sanghavi avatar

Preet writes his thoughts about programming in a simplified manner to help others learn better. With thorough research, his articles offer descriptive and easy to understand solutions.

LinkedIn GitHub

相关文章 - Pandas DataFrame