统计函数
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
本文介绍 机器学习 Studio (经典) 中的模块,这些模块支持对机器学习至关重要的数学和统计操作。 如果需要在试验中执行如下任务,请查看"统计 函数" 类别:
- 对列值执行即席计算,例如舍入或使用绝对值。
- 计算方式、对数以及机器学习中常用的其他统计信息。
- 计算相关性和概率分数。
- 计算 z 分数。
- 计算广泛使用的统计分布,例如 Weibull、gamma 和 beta。
- 基于一组列或数据集生成统计报告。
例如,如果有新数据集,可以先使用 汇总数据 模块。 它为包含标准统计度量值(例如平均值和标准偏差)的整个数据集生成报表。
如果需要更高级的统计信息(例如样本偏斜或四分位距离),请使用计算基本 统计信息 模块生成其他描述性统计信息。
由于模块每次运行试验时都会生成结果,因此,如果数据发生更改,则更新结果。
模块列表
" 统计函数" 类别包括以下模块:
- 应用数学运算:对列值应用数学运算。
- 计算基本统计信息:计算所选数据集列的指定摘要统计信息。
- 计算线性关联:计算数据集中列值之间的线性关联。
- 评估概率函数:适合数据集的指定概率分布函数。
- 替换离散值:将一列中的离散值替换为基于另一列的数字值。
- 汇总数据:为数据集中的列生成基本的描述性统计信息报表。
- 使用 t-Test 测试假设:使用 t-test 比较两个数据集中的含义。