数据转换 - 缩放和缩减

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

本文介绍 机器学习 Studio (经典) 中的模块,这些模块可帮助你处理数值数据。 对于机器学习,常见的数据任务包括剪切、分箱和规范化数值。 其他模块支持降维。

注意

适用于:机器学习 Studio (经典) 应用

可在 Azure 机器学习设计器中获取类似的拖放模块。

对数值数据建模

规范化、分箱或重新分发数值变量等任务是机器学习的数据准备的重要组成部分。 此组中模块支持以下数据准备任务:

  • 将数据分组到不同大小或分布的箱中。
  • 删除离群值或更改其值。
  • 将一组数值规范化为特定范围。
  • 从高维度数据集创建一组精简的特征列。

模块列表

数据转换 - 缩放和缩减 类别包括以下模块:

  • 剪辑值:检测离群值,然后剪辑或替换其值。
  • 将数据分组到箱中:将数值数据放入箱中。
  • 规范化数据:重新缩放数值数据,将数据集值约束为标准范围。
  • 主体组件分析:计算一组维数减少的功能,以更有效地学习。

另请参阅