导出计数表
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
从保存的转换中导出计数表以用于新数据
Category:包含计数的 Learning
模块概述
本文介绍如何使用机器学习 Studio (经典) 中的 "导出计数表" 模块。 提供 " 导出计数表 " 模块是为了向后兼容,其中包含使用不推荐使用的生成计数表和弃用的特征化器模块的实验。
当您使用 "新建 生成计数转换 " 模块创建基于计数的功能时,该模块将同时输出特征化数据集和一个从计数创建特征的 转换 。 通过使用 " 导出计数表 " 模块,您可以将此更新的模块输出的基于计数的特征与计数 元数据 和 计数表分开。 以前的、现在已弃用的模块使用这些输出格式:
有关计数表以及如何使用它们创建功能的常规信息,请参阅具有计数的 Learning。
对于所有新试验,我们建议使用以下模块:
如何配置导出计数表
在机器学习 Studio (经典) 中,打开要在其中使用导入的计数表的实验。
找到保存的计数转换,并将其添加到试验中。
连接已保存的计数转换的输出 (标记为转换) 导出计数表。
将 "计数特征化器 (弃用的) 模块添加到实验,并将其连接到" 导出计数表"的两个输出。
对于要进行特征的数据集, (弃用) 模块的计数特征化器需要额外输入。 连接数据集,以将保存的转换应用于输出。
将 Count 特征化器所需的任何参数设置 (弃用的) ,包括标签列、计数列、要特征的列和要输出的功能。
您必须选择最初为计数转换选择的列的子集。 但是," 导出计数表 " 模块并不提供这些列的列表,因此您应该查看原始试验,并记下所使用的列。 如果选择在创建转换时未使用的列,则会引发错误。
示例
使用 Azure AI 库中的这些示例试验来浏览基于计数的特征化的示例:
航班延迟预测:显示基于计数的特征化在非常大的数据集中如何可用。
带计数的 Learning:具有 NYC 出租车数据的多类分类:说明如何在多类预测任务中使用基于计数的特征。
带计数的 Learning:包含 NYC 出租车数据的二进制分类:在二元分类任务中使用基于计数的特征。
注意
如果打开的库实验是使用 "计数" 模块Learning的弃用版本创建的,则试验会自动升级为使用较新的模块。
预期输入
名称 | 类型 | 说明 |
---|---|---|
计数转换 | ITransform 接口 | 计数转换。 |
Outputs
名称 | 类型 | 说明 |
---|---|---|
Dracula 计数元数据 | 数据表 | 计数的元数据。 |
Dracula 计数表 | 数据表 | 计数表。 |
例外
异常 | 描述 |
---|---|
错误 0003 | 如果一个或多个输入为 NULL 或为空,将出现异常。 |
错误 0086 | 计数转换无效时,将发生异常。 |
有关特定于 Studio (经典) 模块的错误列表,请参阅机器学习错误代码。
有关 API 异常的列表,请参阅机器学习 REST API 错误代码。