选择列转换
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
创建一个转换,该转换选择与给定数据集中相同的列子集
类别: 数据转换/操作
本文介绍如何使用 机器学习 Studio 中的"选择列转换"模块 (经典) 。 选择列 转换 模块的目的是确保在下游机器学习操作中始终使用可预测且一致的列集。
此模块对于需要特定列的任务(如评分)尤其有用。 可用列中的更改可能会中断试验或更改结果。
使用" 选择列转换" 创建并保存一组列。 然后,使用应用转换模块来将那些选择应用于新数据。
如何使用“选择列转换”
此方案假设你打算使用特征选择来生成一组动态列,这些列将用于训练模型。 若要确保评分过程的列选择相同,请使用"选择列转换"模块捕获列选择,并应用于试验中的其他位置。
将输入数据集添加到工作室中的试验 (经典) 。
添加基于筛选器的特征选择的一个实例。
连接模块并配置功能选择模块,以自动在输入数据集中查找一些最佳特征。
添加训练模型的一个实例,并使用基于筛选器的特征选择的输出作为用于训练的输入。
重要
由于特征重要性是根据列中的值决定的,因此无法提前知道哪些列可用于训练 模型的输入。
现在,附加"选择列 转换"模块 的实例。
这会生成列选择作为可保存或应用于其他数据集的转换。 此步骤可确保保存由功能选择标识的列供其他模块重复使用。
添加评分模型模块。
请勿连接输入数据集。
相反,请添加应用转换模块,并连接特征选择转换的输出。
重要
不能期望将 基于筛选器的特征选择 应用于评分数据集,并获取相同的结果。 由于功能选择基于值,因此它可能会选择一组不同的列,这可能会导致评分操作失败。
运行试验。
保存然后应用列选择的这一过程可以确保使用相同的数据架构进行训练和评分。
示例
有关如何使用此模块的示例,请参阅以下 Azure AI 库:
预期输入
名称 | 类型 | 说明 |
---|---|---|
包含所需列的数据集 | 数据表 | 包含所需列集的数据集 |
Outputs
名称 | 类型 | 说明 |
---|---|---|
列选择转换 | ITransform 接口 | 选择与给定数据集中相同的列子集的转换。 |
例外
异常 | 描述 |
---|---|
错误 0003 | 如果一个或多个输入为 NULL 或为空,将出现异常。 |