添加列
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
将一组列从一个数据集添加到另一个
类别: 数据转换/操作
模块概述
本文介绍如何使用 机器学习 Studio (经典) 中的"添加列"模块来连接两个数据集。
将指定为输入的两个数据集中的所有列合并,以便创建一个数据集。 如果需要连接两个以上的数据集,请使用“添加列”的多个实例。
合并包含不同行数的两个数据集时,建议使用联接数据模块,该模块支持对公用键列进行外部联接。
如何配置“添加列”
将" 添加列" 模块添加到试验。
连接要连接的两个数据集。 如果要合并两个以上的数据集,可以将多个“添加列”的组合链接起来。
可以合并具有不同行数的两个列。 对于较小的源列中的每一行,输出数据集中会填充缺失值。
不能选择要添加的单个列。 使用“添加列”时,将连接每个数据集中的所有列。 因此,如果只想添加列的子集,请使用"选择数据集 中的 列"创建包含你选择的列的数据集。
运行试验。
结果
运行试验后:
- 若要查看新数据集的第一行,请右键单击"添加列 "的输出, 然后选择"可视化 "。
- 若要保存连接数据集并将其命名,请右键单击输出并选择" 另存为数据集" 。
新数据集中的列数等于两个输入数据集的列数之和。
如果在输入数据集中存在两个具有相同名称的列,则将一个数字后缀添加到右侧输入列中所用数据集中的列的名称。 例如,如果一个名为“TargetOutcome”的列具有两个实例,则将右侧列重命名为“TargetOutcome (1)”。
示例
有关如何在 试验中使用的 添加列的示例,请参阅以下 Azure AI 库:
预期输入
名称 | 类型 | 说明 |
---|---|---|
左侧数据集 | 数据表 | 左侧数据集 |
右侧数据集 | 数据表 | 右侧数据集 |
输出
名称 | 类型 | 说明 |
---|---|---|
合并的数据集 | 数据表 | 合并的数据集 |
例外
异常 | 描述 |
---|---|
错误 0003 | 如果一个或多个输入数据集为 null 或为空,则会发生异常。 |
错误 0017 | 如果一个或多个指定的列具有不受当前模块支持的类型,则会发生异常。 |
有关特定于工作室和经典 (模块) 的列表,请参阅机器学习代码。
有关 API 异常的列表,请参阅机器学习 REST API代码。