Fabric 消耗中的 Copilot

本页包含有关 Fabric Copilot 使用情况的计费和报告方式的信息。 Copilot 使用情况由处理的令牌数来衡量。 令牌可以视为字词片段。 大约 1,000 个标记大约相当于 750 个字。 每 1,000 个令牌计算价格,输入和输出的令牌消耗速度不同。

注意

Fabric 的 Copilot 将于 2024 年 3 月 1 日开始计费,作为现有 Power BI Premium 或 Fabric 容量的一部分。

消耗率

Copilot 请求会消耗 Fabric 容量单位。 此表定义使用 Copilot 时消耗的容量单位数(CU)。 例如,当用户对 Power BI 使用Copilot、数据工厂 Copilot 或数据科学和数据工程 Copilot 时。

指标应用中的操作 说明 操作度量单位 消耗率
Fabric 中的 Copilot 输入提示 每 1,000 个词元 100 CU 秒
Fabric 中的 Copilot 输出完成 每 1,000 个词元 400 CU 秒

监视使用情况

Fabric 容量指标应用 显示 “Fabric 中的Copilot” 名称下的 Copilot 操作的总容量使用量。此外,Copilot 用户可以在发票项目 “Fabric 中的Copilot” 下查看其 Copilot 使用情况的计费费用摘要。

织物容量指标的屏幕截图。

容量利用率类型

Fabric Copilots 归类为“后台作业”,用于在高峰时段处理较大量的 Copilot 请求。

Fabric 旨在通过使操作能够访问比分配给容量的资源更多的 CU(容量单元)资源来提供闪电般的快速性能。 Fabric 会将“交互式作业”的 CU 使用量在至少 5 分钟内进行平滑或平均处理,而“后台作业”的 CU 使用量则在 24 小时内进行平滑或平均处理。 根据 Fabric 限流策略,当容量在接下来的 10 分钟内消耗了其所有可用的 CU 资源时,限流的第一阶段将开始。

例如,假设每个 Copilot 请求都有 2,000 个输入令牌和 500 个输出令牌。 一个 Copilot 请求的价格计算如下:(2,000 * 100 + 500 * 400) / 1,000 = 700 CU 秒 = 11.66 CU 分钟。

由于 Copilot 是后台作业,因此每个 Copilot 请求(约 24 CU 分钟的作业)在每小时总容量中仅消耗一个 CU 分钟。 对于在 F64 系统中,每天有 64 * 24 CU 小时(即 1,536 CU 小时)的客户来说,每个 Copilot 作业消耗 (24 CU 分钟 / 60 分钟) = 0.4 CU 小时。因此,客户可以在耗尽容量之前处理超过 3,800 个请求。 但是,容量耗尽后,所有操作都将关闭。

区域映射

Fabric Copilot 由 Azure OpenAI 大型语言模型提供支持,这些模型当前部署到 有限的数据中心。 但客户可以启用跨地理位置处理租户设置,通过在其他可使用 Azure OpenAI 服务的区域中处理数据来利用 Copilots。 此区域可能不在用户的地理区域、合规性边界或国家云实例之外。 在执行区域映射时,我们优先考虑数据驻留作为首要考虑因素,并尽量尝试映射到同一地理区域内的区域。

Fabric 容量单位的成本可能因区域而异。 无论使用 GPU 容量的消耗区域如何,客户都会根据其计费区域中的 Fabric 容量单位定价计费。 例如,如果客户的请求从 region 1 映射到 region 2region 1 是计费区域,region 2 为消耗区域,则根据 region 1中的定价对客户收费。

对 Fabric 中 Copilot 消耗率的更改

随时可能会更改消耗率。 Microsoft使用合理的努力通过电子邮件或通过产品内通知提供通知。 更改应在Microsoft的发行说明或Microsoft Fabric 博客中所述的日期生效。 如果 Fabric 中的 Copilot 消耗率的任何变化会显著增加在 Fabric 中使用 Copilot 时所需的容量单位 (CU),客户可以使用所选付款方式提供的取消选项。