使用“复制数据”活动
“复制数据”活动是数据管道最常见的用途之一。 许多管道由单个“复制数据”活动组成,用于将数据从外部源引入湖屋文件或表。
还可以将“复制数据”活动与其他活动结合使用,以创建可重复的数据引入过程,例如,通过使用“删除数据”活动移除现有数据,使用“复制数据”活动将已删除的数据替换为包含外部源数据的文件,以及使用“笔记本”活动运行 Spark 代码,转换文件中的数据并将其加载到表中。
复制数据工具
将“复制数据”活动添加到管道时,图形工具将引导你完成为复制操作配置数据源和目标所需的步骤。 支持广泛的源连接,因此可以从大多数常见源引入数据。 在 OneLake 中,这包括对湖屋、仓库、SQL 数据库等的支持。
“复制数据”活动设置
将“复制数据”活动添加到管道后,可以在管道画布中选择该活动,并在下方的窗格中编辑其设置。
何时使用“复制数据”活动
如果需要在不应用任何转换的情况下直接在受支持的源和目标之间复制数据,或者想要导入原始数据并在以后的管道活动中应用转换,请使用“复制数据”活动。
如果需要在引入数据时对数据应用转换,或合并来自多个源的数据,请考虑使用“数据流”活动运行数据流 (Gen2)。 可以使用 Power Query 用户界面定义包含多个转换步骤的数据流 (Gen2),并将其包含在管道中。
提示
要详细了解 Microsoft Fabric 中的数据流 (Gen2) 以引入数据,请考虑完成使用 Microsoft Fabric 中的数据流 Gen2 引入数据模块。