使用 t 测试来测试假设
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
使用 t-test 比较两列的表示
类别: 统计函数
模块概述
本文介绍如何在 机器学习 Studio 中使用 t-Test 模块 (经典) ,为三种类型的 t-test 生成分数:
- 单一样本 T 测试
- 成对的 T 测试
- 不成对的 T 测试
通常,T 测试可帮助你比较两个组是否具有不同的平均值。 例如,假设你正在针对服用药品 A 的患者和服用药品 B 的患者来评估试验数据,并需要比较这两组的恢复速率指标。 零假设会假定这两组具有相同的恢复速率,并且这两个组的恢复速率的值呈正态分布。
通过使用 测试假设使用 t-Test 并提供包含恢复率的列作为输入,可以获取指示差异是否有意义的分数,这表示应拒绝 null 假设。 该测试考虑以下几个因素:值间的差值、样本的大小(越大越好)以及标准偏差的大小(越小越好)。
通过查看 “使用 t-Test”模块的测试假设 结果,可以确定 null 假设是 TRUE 还是 FALSE,并查看 t-test 中 (P) 分数的置信度。
如何选择 t-test
如果满足以下条件,请选择 单个示例 t-test :
你有一个评分样本。
所有评分互不相关。
xˉ 的采样分布是正态分布。
通常,单个样本 T 测试用于将平均值与已知数字进行比较。
如果满足以下条件,请选择 配对 t-test :
你有一对匹配的评分。 例如,对于每个人或者一对匹配的个人(例如丈夫和妻子),你可能有两个不同的测量值。
每个评分对互不相关。
d 的采样分布是正常的。
在比较相关的案例时,成对的 T 测试非常有用。 通过计算成对案例的评分之差的平均值,可以确定总差值是否具有统计学意义。
如果满足以下条件,请选择 未付 t-test :
你有两个独立的评分样本。 也就是说,没有将样本 1 中的评分与样本 2 中的评分配对的依据。
在示例中的所有评分都是独立的该示例中的所有其他评分。
x1- x2 的采样分布是正常的。
(可选)满足组间差异大致相同这一要求。
如何使用 t-Test 配置测试假设
使用单个数据集作为输入。 要比较的列必须位于同一数据集中。
如果需要比较不同数据集中的列,可以使用 “数据集中的选择列”来隔离每个列,然后使用 “添加列”将它们合并到一个数据集中。
将“使用 t-Test”模块的测试假设添加到实验中。
可以在 Studio (经典) 的 统计函数 类别中找到此模块。
添加包含要分析的列或列的数据集。
确定哪种 t-test 适合数据。 请参阅 如何选择 t-test。
单个示例:如果使用单个示例,请设置以下参数:
空假设μ:键入要用作样本的 null 假设平均值的值。 这指定将对其测试样本平均值的预期平均值。
目标列:使用列选择器选择单个数值列进行测试。
假设类型:选择一尾或两尾测试。 默认值为双尾测试。 这是最常见的测试类型,其中,预期的分布是围绕零对称分布。
One Tail GT 选项用于大于测试的一尾。 此测试通过不测试另一个方向的效果,为检测一个方向的效果提供了更多功能。
One Tail LT 选项提供一尾小于测试。
α:指定置信度因子。 此值用于计算模块) 的第一个输出 (P 的值。 如果 p 低于置信因子,则会拒绝 null 假设。
PairedSamples:如果要比较同一总体中的两个样本,请设置以下参数:
空假设μ:键入一个值,该值表示样本配对之间的样本差异。
目标列:使用列选择器选择要测试的两个数值列。
假设类型:选择一尾或两尾测试。 默认值为双尾测试。
α:指定置信度因子。 此值用于评估模块的第一个输出 (P 的值,) > 如果 p 低于置信因子,则会拒绝 null 假设。
UnpairedSamples:如果比较两个未付费样本,请设置以下参数:
- 假定相等方差:当样本来自不同总体时,请取消选中此选项。
- Null 假设的μ1:键入第一列的平均值。
- Null 假设的μ2:键入第二列的平均值。
- 目标列:使用列选择器选择要测试的两个数值列。
- 假设类型:指示测试是单尾还是双尾。 默认值为双尾测试。
- α:指定置信度因子。 此值用于评估模块的第一个输出 (P 的值,) > 如果 p 低于置信因子,则会拒绝 null 假设。
运行试验。
结果
模块的输出是包含 t-test 分数的数据集,还可以选择保存转换以使用 “应用转换”重新应用于此数据集或其他数据集。
分数数据集包含这些值,而不考虑所使用的 t-test 类型:
- 指示零假设置信度的概率评分
- 指示是否应拒绝零假设的值
提示
请记住,目标是确定是否可以拒绝 null 假设。 分数 0 并不意味着你应该接受 null 假设:这意味着你没有足够的数据,并且需要进一步的调查。
技术说明
根据所选的 T 测试类型,以及结果是拒绝还是接受零假设,该模块按照以下约定自动命名输出列。
给定具有名称和名称{0}{1}的输入列,模块将创建以下名称:
列 | SingleSampleSet | PairedSamples | UnpairedSamples |
---|---|---|---|
输出列 P | {0} P_ss () | {0}P_ps (, {1}) | {0}P_us (、 {1}) |
输出列“RejectH0” | {0} RejectH0_ss () ” | {0}RejectH0_ps (, {1}) | {0}RejectH0_us (, {1}) |
如何计算分数
此模块计算和使用样本标准偏差;因此,公式 (n-1)
在分母中使用。
计算单样本测试的分数
如果是单个评分样本,所有评分都相互独立,并呈正态分布,则评分将按以下方式计算:
采用以下输入:
- 数据集中的单列值
- 零假设 (H0) 参数 μ0
- 由 α 指定的置信度评分
提取 (n 个) 的示例数。
计算样本数据的平均值。
计算样本数据 () 的标准偏差。
(df) 计算 t 和自由度:
使用 t 和 df 从分布表 T 中提取概率 P。
计算配对 t-test 的分数
如果是一组匹配的评分,每对评分都相互独立,且在每组中呈正态分布,则评分将按以下方式计算:
采用以下输入:
- 数据集中的两列值
- null 假设 (H0) 参数 d0
- 由 α 指定的置信度评分
(n) 提取一些示例对。
计算样本数据的差的平均值:
计算 (sd) 差异的标准偏差。
计算 t 和自由度 (df) :
使用 t 和 df 从分布表中提取概率 (P) , (T) 。
计算未付 t-test 的分数
如果是两个独立的评分样本,且值在每个样本中呈正态分布,则评分将按以下方式计算:
采用以下输入:
- 包含两列
doubles
的数据集 - (H0) 参数的零假设 (d0)
- 由 α 指定的置信度评分
- 包含两列
提取每个组、n1 和 n2 中的多个样本。
计算每个样本集的平均值。
将每个组的标准偏差计算为 s1 和 s2。
(df) 计算 t 和自由度:
(可选)满足组间差异大致相同这一要求,计算方法如下。
首先计算合并标准方差:
如果未提出有关差异相等性的假设,请按以下方法计算:
使用 t 和 df 从分发表中提取 P (T) 。
计算 null 假设
指定为 P 的 null 假设的概率计算如下:
如果 P < α,请将“拒绝”标志设置为 True。
如果 P ≥ α,请将“拒绝”标志设置为 False。
预期输入
名称 | 类型 | 说明 |
---|---|---|
数据集 | 数据表 | 输入数据集 |
模块参数
名称 | 范围 | 类型 | 默认 | 说明 |
---|---|---|---|---|
假设类型 | Any | 假设 | 双尾 | 学生的 T 测试零假设类型 |
零假设 μ | Any | Float | 0.0 | 如果是单一样本 T 测试,则为样本的零假设平均值 如果是成对的 T 测试,则为样本差值 |
目标列 | Any | ColumnSelection | 无 | 目标列选择模式 |
假定方差相等 | 任意 | 布尔 | True | 假定两个样本的方差相等 仅适用于不成对的样本 |
零假设 μ1 | Any | Float | 0.0 | 第一个样本的零假设平均值 |
α | [0.0;1.0] | Float | 0.95 | 置信因数(如果 P 小于置信因数,则拒绝零假设) |
Outputs
名称 | 类型 | 说明 |
---|---|---|
P | 数据表 | 指示零假设置信度的概率评分 |
拒绝 H0 | 数据表 | 指示是否应拒绝零假设的值 |
例外
异常 | 描述 |
---|---|
错误 0003 | 如果一个或多个输入为 NULL 或为空,将出现异常。 |
错误 0008 | 如果参数不在范围内,将出现异常。 |
错误 0017 | 如果一个或多个指定列具有当前模块不支持的类型,则会发生异常。 |
错误 0020 | 如果某些数据集中传递给模块的列数太小,则会发生异常。 |
错误 0021 | 如果某些数据集中传递给模块的行数太小,则会发生异常。 |
错误 0031 | 如果列集中的列数小于所需列数,则会发生异常。 |
错误 0032 | 如果参数不是数字,则会发生异常。 |
错误 0033 | 如果参数为无穷大,则会发生异常。 |
有关特定于 Studio (经典) 模块的错误列表,请参阅机器学习错误代码。
有关 API 异常的列表,请参阅机器学习 REST API 错误代码。