从 Dataflow 第 1 代到 Dataflow 第 2 代

Dataflow Gen2 是新一代的数据流。 新一代数据流与 Power BI Dataflow (Gen1) 协同工作,并提供新功能和改进的体验。 以下部分提供了 Dataflow Gen1 和 Dataflow Gen2 之间的比较。

功能概述

功能 Dataflow Gen2 Dataflow Gen1
使用 Power Query 创作数据流
更短的创作流
自动保存和后台发布
数据目标
改进了监视和刷新历史记录
与数据管道集成
大规模计算
通过 Dataflows 连接器获取数据
通过 Dataflows 连接器进行直接查询
增量刷新
AI 见解支持

更短的创作体验

使用 Dataflows Gen2 就像回到家一样。 我们保留了你在 Power BI 数据流中习惯的完整 Power Query 体验。 进入该体验时,系统会逐步引导你将数据导入数据流。 我们还缩短了创作体验,以减少创建数据流所需的步骤数,并添加了一些新功能来改善你的体验。

Screenshot of the overall authoring experience in dataflows.

新的数据流保存体验

在 Dataflow Gen2 中,我们更改了保存数据流的工作方式。 对数据流所做的任何更改都将自动保存到云中。 因此,你可以随时退出创作体验,并以后从离开的位置继续。 创作完数据流后,即可发布更改,并在数据流刷新时使用这些更改。 此外,发布数据流时会保存更改,并会运行必须在后台执行的验证。 使用此功能可以保存数据流,而无需等待验证完成。

若要详细了解新的保存体验,请转到保存数据流的草稿

数据目标

与 Dataflow Gen1 类似,Dataflow Gen2 允许将数据转换为数据流的内部/暂存存储,可以使用 Dataflow 连接器对其进行访问。 Dataflow Gen2 还允许为数据指定数据目标。 现在,此功能还可以分隔 ETL 逻辑和目标存储。 此功能可在很多方面为你提供好处。 例如,你现在可以使用数据流将数据加载到湖屋中,然后使用笔记本来分析数据。 或者,可以使用数据流将数据加载到 Azure SQL 数据库,然后使用数据管道将数据加载到数据仓库中。

在 Dataflow Gen2 中,我们添加了对以下目标的支持,并即将推出更多目标:

  • Fabric Lakehouse
  • Azure 数据资源管理器 (Kusto)
  • Azure Synapse Analytics (SQL DW)
  • Azure SQL 数据库

注意

若要将数据加载到 Fabric Warehouse,可以通过检索 SQL 连接字符串来使用 Azure Synapse Analytics (SQL DW) 连接器。 更多信息:连接到 Microsoft Fabric 中的数据仓库

Screenshot with the supported data destinations displayed.

新的刷新历史记录和监视

在 Dataflow Gen2 中,我们推出了一种用于监视数据流刷新的新方法。 我们集成了对监视中心的支持,并为刷新历史记录体验提供了重大升级。

Screenshot showing the details of a refresh status.

与数据管道集成

数据管道允许对共同执行任务的活动进行分组。 活动是可以执行的工作单元。 例如,活动可以将数据从一个位置复制到另一个位置、运行 SQL 查询、执行存储过程或运行 Python 笔记本。

管道可以包含一个或多个由依赖项连接的活动。 例如,可以使用管道从 Azure Blob 引入和清理数据,然后启动 Dataflow Gen2 来分析日志数据。 还可以使用管道将数据从 Azure Blob 复制到 Azure SQL 数据库,然后在数据库上运行存储过程。

Screenshot showing the integration with data pipelines.

另存为草稿

在 Dataflow Gen2 中,我们引入了无忧的体验,即无需发布即可保存更改。 借助“另存为草稿”功能,每次进行更改时,我们都会存储数据流的草稿版本。 你曾否丢失过 Internet 连接? 你曾否意外关闭过浏览器? 不用担心,我们帮你解决。 返回到数据流后,你最近的更改会仍然存在,你可以从中断的位置继续。 这是一种无缝体验,不需要你提供任何输入。 这使你能够在处理数据流时无需担心丢失更改,也不必在保存更改之前就得修复所有查询错误。 若要了解有关此功能的详细信息,请转到保存数据流的草稿

大规模计算

与 Dataflow Gen1 类似,Dataflow Gen2 还具有增强的计算引擎,以提高引用查询转换和获取数据方案的性能。 为此,Dataflow Gen2 在工作区中创建了 Lakehouse 和 Warehouse 项,并使用它们来存储和访问数据,以提高所有数据流的性能。

许可 Dataflow Gen1 与 Gen2

Dataflow Gen2 是新一代数据流,它与 Power BI Dataflow (Gen1) 协同工作,并提供新功能和改进的体验。 它需要 Fabric 容量或 Fabric 试用版容量。 若要更好地了解数据流许可的工作原理,可以阅读以下文章:Microsoft Fabric 概念和许可证

可以通过重用 Dataflow Gen1 中的查询来试用 Dataflow Gen2

你可能有许多 Dataflow Gen1 查询,并且想知道如何在 Dataflow Gen2 中试用它们。 可以通过几个选项来将 Gen1 数据流重新创建为 Dataflow Gen2。

  • 导出你的 Dataflow Gen1 查询并将其导入 Dataflow Gen2

    你现在可以在 Dataflow Gen1 和 Gen2 创作体验中导出查询,并将其保存到 PQT 文件,然后可以将其导入到 Dataflow Gen2 中。 有关详细信息,请转到使用导出模板功能

  • 在 Power Query 中复制粘贴

    如果你在 Power BI 或 Power Apps 中有数据流,则可以复制你的查询并将其粘贴到 Dataflow Gen2 的编辑器中。 此功能使你能够将数据流迁移到 Gen2,而无需重写查询。 有关详细信息,请转到复制粘贴现有 Dataflow Gen1 查询