数据转换

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

本文列出了 机器学习 Studio (经典) 数据转换中提供的模块。 对于机器学习, 数据转换 需要一些非常常规的任务,例如联接数据集或更改列名。 但是,它还包括特定于机器学习的许多任务,例如规范化、分箱和分组以及推断缺失值。

注意

适用于:机器学习 Studio (经典) 应用

可在 Azure 机器学习设计器中获取类似的拖放模块。

重要

在将 机器学习 Studio (经典) 导入到 机器学习 Studio (经典) 之前,通常在 机器学习 Studio) 。 例如,数据准备可能包括确保数据使用正确的编码并检查数据是否具有一致的架构。

用于数据转换的模块分为以下基于任务的类别:

  • 创建用于数字信号处理的筛选器:数字信号筛选器可应用于数字数据,以支持机器学习任务,例如图像识别、语音识别和波形分析。
  • 生成和使用基于计数的功能:基于计数的特征化模块可帮助你开发在机器学习中使用的精简功能。
  • 常规数据操作和准备:合并数据集、清理缺失值、分组和汇总数据、更改列名和数据类型,或指示哪个列是标签或特征。
  • 采样和拆分数据集:将数据划分为训练集和测试集、按百分比或筛选条件拆分数据集,或执行采样。
  • 缩放和减少数据:通过应用规范化或缩放来准备数值数据进行分析。 将数据分入组、删除或替换离群值,或者对 PCA (执行) 。

模块列表

以下模块类别包含在"数据转换 "类别中

另请参阅