支持 CI/CD 和 Git 集成的数据流 Gen2 (预览版)

数据流 Gen2 现在支持持续集成/持续部署 (CI/CD) 和 Git 集成。 使用此功能可在连接到构造工作区的 Git 存储库中创建、编辑和管理数据流。 此外,还可以使用部署管道功能自动将数据流从自己的工作区部署到其他工作区。 本文更深入地介绍了如何在 Fabric 数据工厂中将数据流 Gen2 与 CI/CD 和 Git 集成结合使用。

新功能

现在使用数据流 Gen2(CI/CD 预览版)时能够:

  • 为 Dataflow Gen2 使用 Git 集成支持。
  • 使用部署管道功能自动将数据流从自己的工作区部署到其他工作区。
  • 使用 Fabric 设置和计划程序刷新和编辑数据流 Gen2 的设置。
  • 直接将数据流 Gen2 创建到工作区文件夹中。

先决条件

若要开始,必须满足以下先决条件:

  • 拥有含有效订阅的 Microsoft Fabric 租户帐户。 免费创建帐户
  • 确保拥有已启用 Microsoft Fabric 的工作区。
  • 若要利用 Git 集成,请确保为工作区启用它。 如需详细了解如何启用 Git 集成,请转到 Git 集成入门

创建含 CI/CD 和 Git 支持的数据流 Gen2

要创建含 CI/CD 和 Git 支持的数据流 Gen2,请执行以下步骤:

  1. 在 Fabric 工作区中,选择“新建项”,然后选择“数据流 Gen2”。

    “新建项”窗口的屏幕截图,其中突出显示了“数据流 Gen2”项。

  2. 为数据流命名并启用 Git 集成。 然后选择“创建”。

    “新建数据流 Gen2”窗口的屏幕截图,其中显示已为数据流命名并突出显示和选中了 Git 集成。

    数据流已创建,并重定向到数据流创作画布。 现在可以开始创作数据流了。

  3. 完成后,选择“保存并运行”。

    Power Query 编辑器的屏幕截图,其中突出显示了“保存并运行”按钮。

  4. 数据流发布后,状态为未提交。

    保存后的数据流 Gen2 的屏幕截图,其中显示状态为未提交。

  5. 要将数据流提交到 Git 存储库,选择工作区视图右上角的源代码管理图标。

    “源代码管理”按钮的屏幕截图。

  6. 选择要提交的所有更改,然后选择“提交”。

    “源代码管理”窗口的屏幕截图,其中显示选中了数据流并突出显示了“提交”按钮。

现在你已拥有支持 CI/CD 和 Git 的数据流 Gen2。 建议在 Fabric 中使用 CI/CD 和 Git 集成时遵循方案 2 - 使用另一个工作区进行开发教程中的最佳做法。

刷新数据流 Gen2 或计划一次刷新

可以通过两种方式(手动或计划刷新)刷新支持 CI/CD 和 Git 的数据流 Gen2。 以下部分介绍如何刷新支持 CI/CD 和 Git 的数据流 Gen2。

立即刷新

  1. 在构造工作区中,选择要刷新的数据流旁边表示更多选项的省略号图标。

  2. 选择“立即刷新”

    更多选项下拉菜单的屏幕截图,其中突出显示了“立即刷新”选项。

计划一次刷新

如果需要定期刷新数据流,可以使用 Fabric 计划程序计划刷新。

  1. 在 Fabric 工作区中,选择要刷新的数据流旁边的表示更多选项的省略号图标。

  2. 选择计划

    “更多选项”下拉菜单的屏幕截图,其中突出显示了“计划”选项。

  3. 在计划页上,可以设置刷新频率、开始时间和结束时间,之后可以更改。

    数据流设置屏幕的屏幕截图,其中显示选中了“计划”选项卡并突出显示了“刷新”按钮。

  4. 要立即开始刷新,选择“刷新”按钮。

刷新历史记录和设置

要查看数据流的刷新历史记录,可以选择下拉菜单中的刷新历史记录选项卡,或进入监视中心,选择要查看其刷新历史记录的数据流。

支持 CI/CD 的数据流 Gen2 设置

访问支持 CI/CD 和 Git 的新数据流 Gen2 的设置与访问任何其他 Fabric 项相似。 可以通过选择数据流旁边的更多选项省略号图标并选择相应设置进行访问。

限制和已知问题

  • 暂存项目在某些体验中可见,如 ALM UI。 将来的所有体验中将隐藏暂存项目。
  • 使用 CI/CD 和 Git 支持删除最后一个数据流 Gen2 时,暂存工件会在工作区中变为可见,并可以由用户安全地删除。
  • 某些体验提及了支持 REST API,但这些 API 尚不可用。 支持 CI/CD 和 Git 的所有数据流 Gen2 在将来均支持构造 Fabric 公共 API。
  • 在 Fabric 数据管道中无法编排支持 CI/CD 和 Git 的 Dataflow Gen2 的刷新。
  • 工作区视图不显示数据流是否有正在进行的刷新。
  • 适用于具有 CI/CD 和 Git 支持的数据流 Gen2 的 Copilot 尚不可用。
  • 数据流创作体验尚不支持 VNet 网关连接。
  • 无法从工作区菜单中导出 Dataflow.json。 导出数据流的解决方法包括:
    • 使用 Fabric 公共 API 获取 Dataflow.json。
    • 使用“导出 Power Query 模板”功能导出数据流定义。
    • 使用 OneLake 资源管理器访问工作区,获取数据流定义。
  • 支持 CI/CD 和 Git 的数据流 Gen2 不支持 Fabric 工作区中的“接管所有权”功能。 因此仅数据流的创建者能编辑数据流。 如果希望在数据流上协同工作,可以使用 Git 存储库中的分支并创建拉取请求来合并更改。 有关详细信息,请转到方案 2 - 使用另一个工作区进行开发
  • 创建分支并切换到另一个工作区时,Dataflow Gen2 刷新可能会失败,并显示一条消息,指出无法找到暂存的湖屋。 发生这种情况时,请在工作区中新建支持 CI/CD 和 Git 的 Dataflow Gen2,以触发暂存湖屋的创建。 之后,工作区中的所有其他数据流都应重新开始运行。
  • 在工作区中创建新项时,它可能会显示项“Dataflow Gen2 (CI/CD,预览版)”。 忽略此内容,并按照本文中所述的说明进行操作。 可能需要一些时间才能在你的区域显示用于启用 CI/CD 和 Git 支持的复选框。
  • 默认情况下,数据流中可能不会启用快速复制。 可以使用数据流设置启用此功能。