模块 1：使用数据工厂创建管道

项目
02/07/2025

此模块需要 10 分钟时间，内容是使用管道中的复制活动将源存储中的原始数据引入数据 Lakehouse 的 Bronze 表。

模块 1 中的概要步骤如下：

创建数据管道。
在管道中使用复制活动将示例数据加载到数据湖屋中。

创建数据管道

需要具有活动订阅的 Microsoft Fabric 租户帐户。创建一个免费帐户。
确保你具有已启用 Microsoft Fabric 的工作区：创建工作区。
登录 Power BI。
选择屏幕左下角的默认 Power BI 图标，然后选择 Fabric。
从“工作区”选项卡中选择工作区，然后选择“+ 新建项”，然后选择 数据管道。提供管道名称。然后选择“创建”。

使用管道中的复制活动将示例数据加载到数据湖屋中

步骤 1：使用复制助手配置复制活动。

选择“复制数据助手”打开复制助手工具。

显示从新管道启动页面选择“复制数据”活动的屏幕截图。

步骤 2：在复制助手中进行配置。

显示了“复制数据”对话框，突出显示了第一步“选择数据源”。从对话框顶部的选项中选择“示例数据”，然后选择“NYC Taxi - Green”。
数据源预览接下来显示在 “连接到数据源” 页面上。查看，然后选择“下一步”。
对于复制助手的“选择数据目标”步骤，请选择“湖屋”，然后选择“下一步”。
在显示的数据目标配置页上，选择“创建新湖屋”，并输入新湖屋的名称。然后再次选择 下一步。
现在，在“选择并映射到文件夹路径或表”页上配置湖屋目标的详细信息。为“根文件夹”选择“表”，提供表名称，然后选择“覆盖”操作。请勿选中在你选择了“覆盖”表操作后显示的“启用分区”复选框。
最后，在复制数据助手的“查看 + 保存”页上，查看配置。在本教程中，请取消选中 “立即开始数据传输” 复选框，因为我们会在下一步骤中手动运行该活动。然后选择“确定”。

步骤 3：运行并查看复制活动的结果。

在管道编辑器中选择“运行”选项卡。然后选择运行按钮，接着在提示中选择 保存并运行，以执行复制活动。
可以监视该运行，并在管道画布下方的“输出”选项卡上检查结果。选择“运行详情”按钮（当鼠标悬停在运行中的管道上时显示的“眼镜”图标）以查看详情。
运行详细信息显示读取和写入的行数为 1,508,501。
展开“持续时间明细”部分，查看复制活动的每个阶段的持续时间。查看复制的详细信息后，选择“关闭”。

在本端到端教程的第一个模块中，您学习了如何在 Microsoft Fabric 中使用 Data Factory 完成首次数据集成：

创建数据管道。
将复制活动添加到管道。
使用示例数据并创建数据 Lakehouse 以将数据存储到新表。
运行管道并查看其详细信息和持续时间明细。

现在，请继续到下一部分以创建您的数据流。

模块 2：使用数据工厂中的数据流转换数据