教程:将数据引入仓库

适用于:✅Microsoft Fabric 中的仓库

本教程介绍如何将数据从 Microsoft Azure 存储引入仓库以创建表。

注意

本教程构成了 端到端方案的一部分。 若要完成本教程,必须先完成以下教程:

  1. 创建工作区
  2. 创建仓库

引入数据

在此任务中,了解如何将数据引入仓库以创建表。

  1. 请确保在 第一个教程中创建的工作区 处于打开状态。

  2. 在工作区登陆窗格中,选择“+ 新建项” 以显示可用项类型的完整列表。

  3. 从列表中,在“获取数据”部分中,选择 数据管道 项目类型。

  4. 在“新建管道”窗口中的“名称”框中,输入 Load Customer Data

    “新建管道”对话框的屏幕截图,其中突出显示了输入的名称。

  5. 要配置管道,请选择“创建”。 当出现“生成数据管道”登陆页时,表明预配已完成。

  6. 在数据管道登陆页上,选择“管道活动”。

    “构建数据管道的登录页面”屏幕截图,其中特别标出了“管道活动”选项。

  7. 在该菜单中,进入“移动和转换”部分,选择“复制数据”。

    “移动和转换”部分的屏幕截图,其中显示了选择“复制数据”的位置。

  8. 在管道设计画布上,选择“复制数据”任务。

    位于设计画布上的“复制数据”的屏幕截图。

  9. 若要设置活动,请在 常规 页上的 名称 框中,将默认文本替换为 CD Load dimension_customer

    “常规”选项卡的屏幕截图,其中显示了输入复制活动名称的位置。

  10. 在“源”页面的“连接”下拉列表中,选择“更多”,显示可以选择的所有数据源,包括 OneLake 目录中的数据源。

  11. 选择“+ 新建 以创建新数据源。

  12. 搜索并选择“Azure Blob”

  13. 在“连接数据源”页上的“账户名或 URL”框中输入 https://fabrictutorialdata.blob.core.windows.net/sampledata/

  14. 请注意,连接名称 下拉列表会自动填充,身份验证类型设置为 Anonymous

    “连接到数据源”窗口的屏幕截图,其中显示了完成的所有设置。

  15. 选择“连接” 。

  16. 在“源”页上,若要访问数据源中的 Parquet 文件,请进行以下设置:

    1. 在“文件路径”框中,输入:

      1. 文件路径 - 容器:sampledata

      2. 文件路径 - 目录:WideWorldImportersDW/tables

      3. 文件路径 - 文件名:dimension_customer.parquet

    2. 在“文件格式”下拉列表中,选择“Parquet”。

  17. 若要预览数据并测试没有错误,请选择 预览数据

    “源”页的屏幕截图,其中突出显示了在前面的步骤和预览数据函数中所做的更改。

  18. Wide World Importers在“目标”页上的“连接”下拉列表中,选择“数据仓库”。

  19. 为“表选项”选择“自动创建表”选项。

  20. 在第一个 框中,输入 dbo

  21. 在第二个框中,输入 dimension_customer

    “目标”页的屏幕截图,其中突出显示了上一步骤中所做的更改的位置。

  22. 在“主页”功能区上,选择“运行”。

  23. “保存并运行?” 对话框中,选择 “保存并运行”,以便让管道加载 dimension_customer 表。

    “保存和运行”对话框的屏幕截图,其中突出显示了“保存和运行”按钮。

  24. 若要监视复制活动的进度,可查看“输出”页中的管道运行活动(等待其完成并显示为“成功”状态)。

    “输出”页的屏幕截图,其中突出显示了“成功”状态。

下一步

教程:在仓库 中使用 T-SQL 创建表