在 Pandas 中执行 T 检验
Preet Sanghavi
2022年5月16日
本教程将讨论如何在 Pandas 中找到 T 检验值。
在 Pandas 中执行 T 检验的步骤
以下是在 Pandas 中执行 T 检验的步骤。
导入相关库
我们必须从 scipy.stats 导入 Pandas 库和 ttest_ind
才能开始。
import pandas as pd
from scipy.stats import ttest_ind
创建一个 Pandas DataFrame
让我们创建一个示例 DataFrame 来对同一 DataFrame 执行 T 检验操作。
data = {
"Category": [
"type2",
"type1",
"type2",
"type1",
"type2",
"type1",
"type2",
"type1",
"type1",
"type1",
"type2",
],
"values": [1, 2, 3, 1, 2, 3, 1, 2, 3, 5, 1],
}
df = pd.DataFrame(data)
我们创建了一个 DataFrame,其中包含一个包含两种类别的类别列,并为每个类别实例分配了一个值。
让我们在下面查看我们的 DataFrame。
print(df)
输出:
Category values
0 type2 1
1 type1 2
2 type2 3
3 type1 1
4 type2 2
5 type1 3
6 type2 1
7 type1 2
8 type1 3
9 type1 5
10 type2 1
我们现在将使用以下代码为这两种类别类型创建一个单独的 DataFrame。此步骤有助于 T 检验查找过程。
type1 = my_data[my_data["Category"] == "type1"]
type2 = my_data[my_data["Category"] == "type2"]
在 Pandas 中获取 T 检验值
我们现在将找到 T 检验结果并使用 ttest_ind()
函数将它们存储在一个变量中。我们通过以下方式使用此功能。
res = ttest_ind(type1["values"], type2["values"])
在上面的代码中,我们将 DataFrame 作为参数传递给函数,我们得到了 T 检验结果,包括一个具有 t 统计量和 p 值的元组。
现在让我们打印 res
变量以查看结果。
print(res)
输出:
Ttest_indResult(statistic=1.4927289925706944, pvalue=0.16970867501294376)
在上面的输出中,我们找到了具有 t 统计量和 p 值的 T 检验值。因此,我们可以通过上述方法成功找到 Pandas 中的 T 检验值。
作者: Preet Sanghavi