使用 t 测试来测试假设

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

使用 t-test 比较两列的表示

类别: 统计函数

注意

仅适用于机器学习 Studio (经典)

可在 Azure 机器学习设计器中获取类似的拖放模块。

模块概述

本文介绍如何在 机器学习 Studio 中使用 t-Test 模块 (经典) ,为三种类型的 t-test 生成分数:

  • 单一样本 T 测试
  • 成对的 T 测试
  • 不成对的 T 测试

通常,T 测试可帮助你比较两个组是否具有不同的平均值。 例如,假设你正在针对服用药品 A 的患者和服用药品 B 的患者来评估试验数据,并需要比较这两组的恢复速率指标。 零假设会假定这两组具有相同的恢复速率,并且这两个组的恢复速率的值呈正态分布。

通过使用 测试假设使用 t-Test 并提供包含恢复率的列作为输入,可以获取指示差异是否有意义的分数,这表示应拒绝 null 假设。 该测试考虑以下几个因素:值间的差值、样本的大小(越大越好)以及标准偏差的大小(越小越好)。

通过查看 “使用 t-Test”模块的测试假设 结果,可以确定 null 假设是 TRUE 还是 FALSE,并查看 t-test 中 (P) 分数的置信度。

如何选择 t-test

如果满足以下条件,请选择 单个示例 t-test

  • 你有一个评分样本。

  • 所有评分互不相关。

  • xˉ 的采样分布是正态分布。

通常,单个样本 T 测试用于将平均值与已知数字进行比较。

如果满足以下条件,请选择 配对 t-test

  • 你有一对匹配的评分。 例如,对于每个人或者一对匹配的个人(例如丈夫和妻子),你可能有两个不同的测量值。

  • 每个评分对互不相关。

  • d 的采样分布是正常的。

在比较相关的案例时,成对的 T 测试非常有用。 通过计算成对案例的评分之差的平均值,可以确定总差值是否具有统计学意义。

如果满足以下条件,请选择 未付 t-test

  • 你有两个独立的评分样本。 也就是说,没有将样本 1 中的评分与样本 2 中的评分配对的依据。

  • 在示例中的所有评分都是独立的该示例中的所有其他评分。

  • x1- x2 的采样分布是正常的。

  • (可选)满足组间差异大致相同这一要求。

如何使用 t-Test 配置测试假设

使用单个数据集作为输入。 要比较的列必须位于同一数据集中。

如果需要比较不同数据集中的列,可以使用 “数据集中的选择列”来隔离每个列,然后使用 “添加列”将它们合并到一个数据集中。

  1. 将“使用 t-Test”模块的测试假设添加到实验中。

    可以在 Studio (经典) 的 统计函数 类别中找到此模块。

  2. 添加包含要分析的列或列的数据集。

  3. 确定哪种 t-test 适合数据。 请参阅 如何选择 t-test

  4. 单个示例:如果使用单个示例,请设置以下参数:

    • 空假设μ:键入要用作样本的 null 假设平均值的值。 这指定将对其测试样本平均值的预期平均值。

    • 目标列:使用列选择器选择单个数值列进行测试。

    • 假设类型:选择一尾或两尾测试。 默认值为双尾测试。 这是最常见的测试类型,其中,预期的分布是围绕零对称分布。

      One Tail GT 选项用于大于测试的一尾。 此测试通过不测试另一个方向的效果,为检测一个方向的效果提供了更多功能。

      One Tail LT 选项提供一尾小于测试。

    • α:指定置信度因子。 此值用于计算模块) 的第一个输出 (P 的值。 如果 p 低于置信因子,则会拒绝 null 假设。

  5. PairedSamples:如果要比较同一总体中的两个样本,请设置以下参数:

    • 空假设μ:键入一个值,该值表示样本配对之间的样本差异。

    • 目标列:使用列选择器选择要测试的两个数值列。

    • 假设类型:选择一尾或两尾测试。 默认值为双尾测试。

    • α:指定置信度因子。 此值用于评估模块的第一个输出 (P 的值,) > 如果 p 低于置信因子,则会拒绝 null 假设。

  6. UnpairedSamples:如果比较两个未付费样本,请设置以下参数:

    • 假定相等方差:当样本来自不同总体时,请取消选中此选项。
    • Null 假设的μ1:键入第一列的平均值。
    • Null 假设的μ2:键入第二列的平均值。
    • 目标列:使用列选择器选择要测试的两个数值列。
    • 假设类型:指示测试是单尾还是双尾。 默认值为双尾测试。
    • α:指定置信度因子。 此值用于评估模块的第一个输出 (P 的值,) > 如果 p 低于置信因子,则会拒绝 null 假设。
  7. 运行试验。

结果

模块的输出是包含 t-test 分数的数据集,还可以选择保存转换以使用 “应用转换”重新应用于此数据集或其他数据集。

分数数据集包含这些值,而不考虑所使用的 t-test 类型:

  • 指示零假设置信度的概率评分
  • 指示是否应拒绝零假设的值

提示

请记住,目标是确定是否可以拒绝 null 假设。 分数 0 并不意味着你应该接受 null 假设:这意味着你没有足够的数据,并且需要进一步的调查。

技术说明

根据所选的 T 测试类型,以及结果是拒绝还是接受零假设,该模块按照以下约定自动命名输出列。

给定具有名称和名称{0}{1}的输入列,模块将创建以下名称:

SingleSampleSet PairedSamples UnpairedSamples
输出列 P {0} P_ss () {0}P_ps (, {1}) {0}P_us (、 {1})
输出列“RejectH0” {0} RejectH0_ss () ” {0}RejectH0_ps (, {1}) {0}RejectH0_us (, {1})

如何计算分数

此模块计算和使用样本标准偏差;因此,公式 (n-1) 在分母中使用。

计算单样本测试的分数

如果是单个评分样本,所有评分都相互独立,并呈正态分布,则评分将按以下方式计算:

  1. 采用以下输入:

    • 数据集中的单列值
    • 零假设 (H0) 参数 μ0
    • α 指定的置信度评分
  2. 提取 (n 个) 的示例数。

  3. 计算样本数据的平均值。

  4. 计算样本数据 () 的标准偏差。

  5. (df) 计算 t 和自由度:

    Formula for degrees of freedom

  6. 使用 t 和 df 从分布表 T 中提取概率 P。

计算配对 t-test 的分数

如果是一组匹配的评分,每对评分都相互独立,且在每组中呈正态分布,则评分将按以下方式计算:

  1. 采用以下输入:

    • 数据集中的两列值
    • null 假设 (H0) 参数 d0
    • α 指定的置信度评分
  2. (n) 提取一些示例对。

  3. 计算样本数据的差的平均值:

    formula for mean of differences

  4. 计算 (sd) 差异的标准偏差。

  5. 计算 t 和自由度 (df) :

    Formula for degrees of freedom df

  6. 使用 t 和 df 从分布表中提取概率 (P) , (T) 。

计算未付 t-test 的分数

如果是两个独立的评分样本,且值在每个样本中呈正态分布,则评分将按以下方式计算:

  1. 采用以下输入:

    • 包含两列 doubles 的数据集
    • (H0) 参数的零假设 (d0)
    • α 指定的置信度评分
  2. 提取每个组、n1 和 n2 中的多个样本。

  3. 计算每个样本集的平均值。

  4. 将每个组的标准偏差计算为 s1 和 s2。

  5. (df) 计算 t 和自由度:

(可选)满足组间差异大致相同这一要求,计算方法如下。

  1. 首先计算合并标准方差:

    formula for pooled standard distribution

  2. 如果未提出有关差异相等性的假设,请按以下方法计算:

    formula for pooled standard deviation

  3. 使用 t 和 df 从分发表中提取 P (T) 。

计算 null 假设

指定为 P 的 null 假设的概率计算如下:

  • 如果 P < α,请将“拒绝”标志设置为 True。

  • 如果 P ≥ α,请将“拒绝”标志设置为 False。

预期输入

名称 类型 说明
数据集 数据表 输入数据集

模块参数

名称 范围 类型 默认 说明
假设类型 Any 假设 双尾 学生的 T 测试零假设类型
零假设 μ Any Float 0.0 如果是单一样本 T 测试,则为样本的零假设平均值

如果是成对的 T 测试,则为样本差值
目标列 Any ColumnSelection 目标列选择模式
假定方差相等 任意 布尔 True 假定两个样本的方差相等

仅适用于不成对的样本
零假设 μ1 Any Float 0.0 第一个样本的零假设平均值
α [0.0;1.0] Float 0.95 置信因数(如果 P 小于置信因数,则拒绝零假设)

Outputs

名称 类型 说明
P 数据表 指示零假设置信度的概率评分
拒绝 H0 数据表 指示是否应拒绝零假设的值

例外

异常 描述
错误 0003 如果一个或多个输入为 NULL 或为空,将出现异常。
错误 0008 如果参数不在范围内,将出现异常。
错误 0017 如果一个或多个指定列具有当前模块不支持的类型,则会发生异常。
错误 0020 如果某些数据集中传递给模块的列数太小,则会发生异常。
错误 0021 如果某些数据集中传递给模块的行数太小,则会发生异常。
错误 0031 如果列集中的列数小于所需列数,则会发生异常。
错误 0032 如果参数不是数字,则会发生异常。
错误 0033 如果参数为无穷大,则会发生异常。

有关特定于 Studio (经典) 模块的错误列表,请参阅机器学习错误代码

有关 API 异常的列表,请参阅机器学习 REST API 错误代码

另请参阅

统计函数