Microsoft Fabric 中数据工厂的 Dataflow Gen2 定价

借助 Dataflow Gen2,能够利用低代码接口和超过 300 个基于数据和 AI 的转换,从而能够比使用任何其他工具更轻松、更灵活地转换数据。 Dataflow Gen2 是使用熟悉的 Power Query 体验创作的,该体验目前可用于多个 Microsoft 产品和服务,例如 Excel、Power BI、Power Platform、Dynamics 365 Insights 应用程序等。 发布数据流后,将生成数据流定义,这是在刷新数据流后将运行的程序,以在暂存存储和/或输出目标中生成表。 刷新期间,数据流引擎将使用数据流的定义来生成业务流程计划、管理资源和协调跨数据源、网关和计算引擎执行查询,以及在临时存储或数据目标中创建表。

Dataflow Gen2 体系结构示意图。

此处所示的关系图捕获了数据工厂 Dataflow Gen2 体系结构的各个组件,包括用于暂存要引入的数据的湖屋,以及用作计算引擎和更快地将结果写回到暂存或支持的输出目标的方式的仓库生成工件。 在无法使用仓库计算或对查询禁用暂存时,Mashup 引擎将提取、转换数据,或将数据加载到暂存或数据目标。 可以在以下博客文章中详细了解 Dataflow Gen2 的工作原理:数据工厂聚焦:Dataflow Gen2

在刷新或发布 Dataflow Gen2 项时,以下引擎将使用 Fabric 容量单位。

  • 标准计算:将会基于通过 Mashup 引擎运行的所有数据流查询的查询计算时间向你收费。
  • 大规模数据流计算:基于 Lakehouse(暂存存储)和仓库(存储计算)SQL 引擎消耗持续时间,在启用暂存时向你收费。

Dataflow Gen2 定价模型

下表指示为了确定 Dataflow Gen2 执行成本,每个查询执行将利用混合引擎进行标准计算,bingqie 计算执行持续时间将转换为每小时 16 CU 的消耗率。 其次,对于启用暂存时的大规模计算方案,还应考虑 Lakehouse/Warehouse SQL 引擎执行持续时间。 计算执行持续时间转换为每小时 6 CU 的消耗率。 在每个 Dataflow Gen2 运行结束时,会对每个引擎类型的容量单位 (CU) 消耗求和,并根据部署区域中 Fabric 容量的转换价格计费。

Dataflow Gen2 引擎类型 消耗计量 Fabric CU 消耗率 消耗报告精细度
标准计算 根据每个混合引擎查询执行持续时间(以秒为单位)。 每小时 16 CU 每个 Dataflow Gen2 项
大规模数据流计算 基于 Lakehouse/Warehouse SQL 引擎执行(已启用暂存)持续时间(以秒为单位)。 每小时 6 CU 每工作区
数据移动 基于快速复制运行持续时间(以小时为单位)以及使用的智能优化吞吐量资源。 每小时 1.5 CU 每个 Dataflow Gen2 项

Dataflow Gen2 的虚拟网络数据网关定价

虚拟网络 (VNET) 数据网关的计费形式为附加基础结构费用,与 Fabric 容量关联。 这意味着它具有自己的计量,并产生一笔在所有 Fabric 项运行中一致且额外的费用。

通过 VNET 数据网关运行 Dataflows Gen2 的总费用计算方式如下:Dataflows Gen2 费用 + VNET 数据网关费用。

VNET 数据网关费用与 VNET 数据网关的使用量成正比,其中使用量定义为正常运行时间,或 VNET 数据门户打开的任何时间。

VNET 数据网关 CU 消耗率:(4 CU 小时)*(每单位价格的 Fabric 容量)

有关详细信息,请参阅虚拟网络数据网关定价和计费

对 Microsoft Fabric 工作负载消耗率的更改

消耗率可能会随时更改。 Microsoft 将尽合理努力通过电子邮件和产品内通知提供通知。 更改在发行说明Microsoft Fabric 博客中声明的日期生效。 如果对 Microsoft Fabric 工作负载消耗率的任何更改会显著增加使用特定工作负载所需的容量单位 (CU),客户可以使用适用于所选付款方式的取消选项。

使用 Fabric 指标应用计算估计成本

Microsoft Fabric 容量指标应用提供了与容量相关的所有 Fabric 工作区的容量使用情况的可见性。 容量管理员可使用它来监视工作负载的性能及其与购买的容量相比较的使用情况。 使用指标应用是估算 Dataflow Gen2 刷新运行成本的最准确方法。 在对方案进行负载测试时,请在新工作区中创建 Dataflow Gen2 项以减少 Fabric 指标应用中报告的任何干扰。

可以利用下表作为模板来计算使用 Fabric 指标应用进行 Dataflow Gen2 刷新的估计成本:

指标 标准计算 大规模计算
总 CU 数 s CU 秒 h CU 秒
计费的有效 CU 小时数 s / (60*60) = S CU 小时 h / (60*60) = H CU 小时

总刷新成本 =(S + H CU 小时)*(每单价 Fabric容量)