应用转换

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

将明确指定的数据转换应用于数据集

类别:机器学习/分数

注意

适用于:仅限机器学习 Studio (经典)

可在 Azure 机器学习设计器中获取类似的拖放模块。

模块概述

本文介绍如何使用机器学习 Studio 中的 "应用转换" 模块 (经典) ,以基于之前计算的转换修改输入数据集。

例如,如果使用了 z 分数通过“规范化数据”模块来规范化训练数据,则可能还需要使用在评分阶段为训练计算的 z 分数值。 在机器学习 Studio (经典) ,可以通过将规范化方法保存为转换来轻松地执行此操作,然后使用 "应用转换" 将 z 分数应用到输入数据,然后进行评分。

机器学习 Studio (经典) 为创建和应用多种不同类型的自定义转换提供支持。 例如,你可能希望保存并重新使用执行下列操作的转换:

  • 使用“清理缺失数据”来删除或替换缺失值

  • 使用规范化数据或将数据分组到箱中,对数据进行分类、缩放和标准化

  • 使用带有计数模块的 Learning,通过计算数据集的联合概率分布来创建一组精简功能。

如何使用“应用转换”

  1. 向试验中添加 " 应用转换 " 模块。 可以在 "评分" 类别中的 "机器学习" 下找到 "thi" 模块。

  2. 找到要用作输入的现有转换。

    如果转换是在试验中前面创建的 (例如,作为清理或数据缩放操作的一部分) 通常情况下, ITransform 接口 对象在模块的右侧输出中可用。 连接输出到 "应用转换" 的左侧输入。

    以前保存的转换可在左侧导航窗格的“转换”组中找到。

    提示

    如果为试验设计转换,但未显式保存,则只要会话处于打开状态,该转换就会出现在工作区中。 如果关闭会话但未保存转换,则可以重新运行试验以生成 ITransform 接口 对象。

  3. 连接要转换的数据集。 数据集应具有与首次为其设计了转换的数据集相同的架构(列数、列名、数据类型)。

  4. 不需要设置任何其他参数;所有自定义是在定义该转换时完成的。

  5. 若要将转换应用于新数据集,请运行试验。

示例

若要查看如何在机器学习中使用此模块,请参阅 Azure AI 库

技术说明

" 应用转换 " 模块可以将创建 ITransform 接口的任何模块的输出作为输入。 这些模块包括:

提示

还可以保存和重复使用为数字信号处理设计的筛选器。 不过,筛选器使用 IFilter 接口 接口,而不是 ITransform 接口

预期输入

名称 类型 说明
转换 ITransform 接口 一元数据转换
数据集 数据表 要转换的数据集

Outputs

名称 类型 说明
转换后的数据集 数据表 转换后的数据集

例外

异常 描述
错误 0003 如果一个或多个输入为 NULL 或为空,将出现异常。

有关特定于 Studio (经典) 模块的错误列表,请参阅机器学习错误代码

有关 API 异常的列表,请参阅机器学习 REST API 错误代码

另请参阅

Filter
应用 SQL 转换
清理缺失数据
规范化数据
A-Z 模块列表
将数据分组到箱中