Microsoft Fabric 数据工厂中复制作业的 CI/CD(预览版)

若要使用复制作业构建成功的数据分析项目,拥有源代码控制、持续集成、持续部署和协作开发环境非常重要。

在 Fabric 中,我们目前与应用程序生命周期管理 (ALM) 团队合作支持两项功能:Git 集成和部署管道。 这些功能允许用户导入/导出带有单独更新的工作区资源。

通过支持复制作业的 Git 集成和部署管道,用户可以利用自己在 Azure DevOps 或 GitHub 中的 Git 存储库以及 Fabric 的内置部署管道,实现无缝的 CI/CD 工作流程。 此集成标志着向扩展所有 Fabric 项目的 CI/CD 功能迈出了重要一步,为用户的数据项目提供了先进、可靠的开发工具。

开始使用适用于复制作业的 Git 集成

按照以下步骤为数据工厂中的复制作业设置 Git 集成:

Git 集成的先决条件

若要使用 Microsoft Fabric 工作区访问 Git,请确保满足以下针对 Fabric 和 Git 的先决条件。

步骤 1:连接到 Git 存储库

若要在 Fabric 中使用与复制作业的 Git 集成,首先需要连接到 Git 存储库,如此处所述。

  1. 登录到 Fabric 并导航到要连接到 Git 的工作区。

  2. 选择“工作区设置”。

    显示在 Fabric UI 中选择工作区设置的位置的屏幕截图。

  3. 选择“git 集成”。

  4. 选择 Git 提供程序。 目前,Fabric 仅支持 Azure DevOps 或 GitHub。 如果使用 GitHub,则需要选择“添加帐户”来连接 GitHub 帐户。 登录后,选择“连接”,允许 Fabric 访问 GitHub 帐户。

    显示在何处为 Fabric 工作区 Git 集成添加 GitHub 帐户的屏幕截图。

步骤 2:连接到工作区

连接到 Git 存储库后,需要连接到工作区,如此处所述。

  1. 在下拉菜单中,指定要连接到的分支的以下详细信息:

    1. 对于 Azure DevOps 分支连接,请指定以下详细信息:

      • 组织:Azure DevOps 组织名称。
      • 项目:Azure DevOps 项目名称。
      • 存储库:Azure DevOps 存储库名称。
      • 分支:Azure DevOps 分支名称。
      • 文件夹:Azure DevOps 文件夹名称。
    2. 对于 GitHub 分支连接,请指定以下详细信息:

      • 存储库 URL:GitHub 存储库 URL。
      • 分支:GitHub 分支名称。
      • 文件夹:GitHub 文件夹名称。
  2. 选择“连接并同步”。

  3. 连接后,工作区将显示有关源代码管理的信息,用户可以通过该信息查看连接的分支、分支中每个项的状态以及上次同步的时间。

    显示 Fabric 工作区的屏幕截图,其中包含 Git 状态和复制作业报告的其他详细信息。

步骤 3:将更改提交至 Git

现在可以将更改提交至 Git,如此处所述。

  1. 转到工作区。
  2. 选择“源代码管理”图标。 此图标显示未提交的更改数。
  3. 从“源代码管理”面板中选择“更改”选项卡。 此时会显示一个列表,其中包含更改的所有项目以及指示状态的图标。
  4. 选择想要删除的项目。 若要选择所有项目,检查顶部框。
  5. (可选)在方框中添加提交注释。
  6. 选择“提交”。

提交更改后,已提交的项将从列表中删除,工作区将指向同步到的新提交。

已提交的复制作业项的屏幕截图。

开始使用适用于 Git 的部署管道

按照以下步骤将 Git 部署管道与 Fabric 工作区结合使用。

部署管道的先决条件

在开始之前,请务必设置以下先决条件:

步骤 1:创建部署管道

  1. 在“工作区”浮出控件中,选择“部署管道”。

步骤 2:为管道命名并分配阶段

  1. “创建部署管道”对话框中,输入管道的名称和描述,然后选择“下一步”
  2. 通过定义部署管道所需的阶段来设置部署管道的结构。 默认情况下,管道有三个阶段,分别为开发、测试和生产

步骤 3:将工作区分配给部署管道

创建管道后,需要将想要管理的内容添加到管道。 向管道添加内容是通过将工作区分配到管道阶段来完成的。 可以将工作区分配到任何阶段。 按照说明将工作区分配给管道

步骤 4:部署到空阶段

  1. 处理完一个管道阶段中的内容后,可以将其部署到下一阶段。 在部署内容时,部署管道会提供三个选项:

    • 完整部署:将所有内容部署到目标阶段。
    • 选择性部署:选择要部署到目标阶段的内容。
    • 向后部署:将内容从管道中的后期阶段部署到早期阶段。 目前,仅当目标阶段为空(没有分配给它的工作区)时,才可能进行向后部署。
  2. 选择如何部署内容后,可以查看部署并留下备注

步骤 5:将内容从一个阶段部署到另一个阶段

  1. 在管道阶段中有内容后,即使下一阶段工作区包含内容,也可以将其部署到下一阶段。 将覆盖配对的项。 有关此过程的详细信息,请参阅将内容部署到现有工作区部分。

  2. 可以查看部署历史记录,看到最后一次将内容部署到每个阶段的时间。 若要在部署之前检查两个管道之间的差异,请参阅比较不同部署阶段的内容

    复制作业的部署管道的屏幕截图。

已知限制

以下已知限制适用于 Microsoft Fabric 中数据工厂的复制作业的 CI/CD:

  • 工作区变量:CI/CD 当前不支持工作区变量。
  • Git 集成有限支持:目前,Fabric 仅支持 Git 与 Azure DevOps 和 GitHub 的集成。 建议使用 Azure DevOps Git 集成,因为 GitHub Git 集成具有更多限制。