教程:将数据引入 Microsoft Fabric 中的仓库

适用于:✅Microsoft Fabric 中的仓库

在 Microsoft Fabric 中创建仓库后,可以将数据引入该仓库。

引入数据

  1. 从“生成仓库”登陆页中,选择导航菜单中的“数据仓库教程”工作区,以返回到工作区项列表。

    导航菜单的屏幕截图,显示在哪里选择“数据仓库教程”。

  2. 选择“新建”>“更多选项”以显示可用项的完整列表。

  3. 在“数据工厂”部分中,选择“数据管道”。

  4. 在“新建管道”对话框中,输入 Load Customer Data 作为名称。

    “新建管道”对话框的屏幕截图,显示在哪里输入名称并选择“创建”。

  5. 选择创建

  6. 选择“管道活动”

    “管道活动”按钮的屏幕截图。

  7. 从“移动和转换”部分选择“复制数据”

    “移动和转换”部分的屏幕截图,显示在哪里选择“复制数据”。

  8. 如有必要,请从设计画布中选择新创建的“复制数据”活动,并按照后续步骤对其进行配置。

  9. 在“常规”页上,对于“名称”,输入 CD Load dimension_customer

    “常规”选项卡的屏幕截图,显示在哪里输入复制活动名称。

  10. “源”页上,选择“连接”下拉列表。 选择“更多”以查看可供选择的所有数据源,包括本地 OneLake 数据中心中的数据源。

  11. 若要创建新连接,请选择“新建”

  12. “新建连接”页上进行选择或键入,从连接选项列表中选择“Azure Blob”。

  13. 选择“继续”。

  14. 在“连接设置”页上,按如下所示配置设置:

    1. 在“帐户名称或 URL”中,输入 https://azuresynapsestorage.blob.core.windows.net/sampledata/

    2. 在“连接凭证”部分中,选择“连接”下拉列表中的“创建新连接”

    3. “连接名称”字段会自动填充,但为了清楚起见,请键入 Wide World Importers Public Sample

    4. 将“身份验证类型”设置为“匿名”。

    “连接设置”屏幕的屏幕截图,其中按照前面步骤中的指示填写了“帐户名称”和“连接凭据”字段。

  15. 选择“连接” 。

  16. 按如下所示更改复制活动的“”页上的其余设置,以访问 https://azuresynapsestorage.blob.core.windows.net/sampledata/WideWorldImportersDW/parquet/full/dimension_customer/*.parquet 中的 .parquet 文件:

    1. 在“文件路径”文本框中,提供:

      1. 容器sampledata

      2. 文件路径 - 目录: WideWorldImportersDW/tables

      3. 文件路径 - 文件名: dimension_customer.parquet

    2. 在“文件格式”下拉列表中,选择“Parquet”。

  17. 选择“文件路径”设置旁边的“预览数据”以确保没有错误。

    “源”选项卡的屏幕截图,显示在哪里更改文件路径和格式详细信息并选择“预览数据”。

  18. 选择“复制数据”活动的“目标”页。 在“连接”中,请从列表中选择仓库项 WideWorldImporters,或选择“更多”以搜索仓库。

  19. 在“表选项”配置设置旁边,选择“自动创建表”单选按钮。

  20. “表”配置设置旁边的下拉菜单将自动更改为两个文本框。

  21. 在“”设置旁边的第一个框中,输入 dbo

  22. 在“”设置旁边的第二个框中,输入 dimension_customer

    “目标”选项卡的屏幕截图,显示在哪里输入和选择前面步骤中指定的详细信息。

  23. 在功能区中,选择“运行”。

  24. 从对话框中选择“保存并运行”。 用于加载 dimension_customer 表的管道启动。

  25. 在“输出”页上监视复制活动的进度,并等待其完成。

    “输出”页面的屏幕截图,显示成功运行的外观。

下一步