Fabric 中的 Copilot 消耗
此页面包含有关如何计费和报告 Fabric Copilot 使用情况的信息。 Copilot 使用情况由处理的令牌数来度量。 可以将令牌视为字词片段。 大约 1,000 个令牌是大约 750 字。 价格按 1,000 个令牌计算,输入和输出令牌以不同的速率消耗。
注意
Copilot for Fabric 计费将于 2024 年 3 月 1 日生效,作为现有 Power BI 高级版或 Fabric 容量的一部分。
消耗率
对 Copilot 的请求消耗 Fabric 容量单位。 此表定义使用 Copilot 时消耗的容量单位 (CU) 数。 例如,当用户使用 Copilot for Power BI、数据工厂 Copilot 或适用于数据科学和数据工程的 Copilot 时。
指标应用中的操作 | 描述 | 操作度量单位 | 消耗率 |
---|---|---|---|
Fabric 中的 Copilot | 输入提示 | 每 1,000 个令牌 | 400 CU 秒 |
Fabric 中的 Copilot | 输出完成 | 每 1,000 个令牌 | 1,200 CU 秒 |
监视使用情况
Fabric 容量指标应用以“Fabric 中的 Copilot”名称显示 Copilot 操作的总容量使用情况。此外,Copilot 用户还能够在发票项“Fabric 中的 Copilot”下查看其 Copilot 使用情况计费费用的摘要。
容量利用率类型
Fabric Copilot 被归类为“后台作业”,作为在高峰时段处理更多 Copilot 请求的容量利用率类型。
Fabric 旨在通过允许操作访问比分配给容量更多的 CU(容量单位)资源来提供闪电般的性能。 Fabric 对至少 5 分钟“交互式作业”和 24 小时“后台作业”的 CU 使用情况进行平滑或平均。 根据 Fabric 限制策略,当容量在接下来的 10 分钟内消耗完所有可用的 CU 资源时,将开始第一阶段的限制。
例如,假设每个 Copilot 请求都有 2000 个输入令牌和 500 个输出令牌。 一个 Copilot 请求的价格 = (2000 * 400+500 * 1200)/1000 = 1400 CU 秒 = 23.33 CU 分钟。
Copilot 是一项后台作业,每个 Copilot 请求(约 24 CU 分钟作业)每小时仅消耗 1 CU 分钟的容量。 对于 F64 上的客户,一天有 64 * 24 CU 小时 (1536),每个 Copilot 作业消耗(24 CU 分钟/60 分钟)= 0.4 CU 小时。 客户可以在耗尽容量之前运行超过 3800 个请求,但随后一切都会关闭。
地区映射
Fabric Copilot 由 Azure OpenAI 大型语言模型提供支持,目前已部署到有限的数据中心。 但是,客户可以启用跨地理流程租户设置,通过在提供 Azure OpenAI 服务的另一个区域处理数据来使用 Copilot。 该区域可能位于用户的地理区域、合规边界或国家云实例之外。 在执行区域映射时,我们将数据驻留作为首要考虑因素,并在可行的情况下尝试映射到同一地理区域内的区域。
结构容量单位的成本可能因区域而异。 无论使用 GPU 容量的消费区域如何,客户都将根据其计费区域中的结构容量单位定价进行计费。 例如,如果客户的请求从 region 1
映射到 region 2
,其中 region 1
为计费区域且 region 2
为消费区域,则将根据 region 1
中的定价向客户收费。
Fabric 使用率中 Copilot 的更改
消耗率可能会随时更改。 Microsoft 会采用合理的措施通过电子邮件或产品内通知来通知用户。 更改将在 Microsoft 发行说明或 Microsoft Fabric 博客中提到的日期开始生效。 如果对 Fabric 中的 Copilot 消耗率的任何更改会显著增加使用 Fabric 中的 Copilot 所需的容量单位 (CU),则客户可以使用适用于所选付款方式的取消选项。