Copilot en el consumo de Fabric
Esta página contiene información sobre cómo se factura y notifica el uso de Fabric Copilot. El uso de Copilot se mide mediante el número de tokens procesados. Los tokens se pueden considerar como fragmentos de palabras. Aproximadamente 1000 tokens son aproximadamente 750 palabras. Los precios se calculan por 1000 tokens, y los tokens de entrada y salida se consumen a diferentes tarifas.
Nota
El Copilot para la facturación de Fabric entrará en vigor el 1 de marzo de 2024, como parte de su suscripción existente a Power BI Premium o Fabric.
Tasa de consumo
Las solicitudes para Copilot consumen unidades de capacidad de Fabric. En esta tabla se define cuántas unidades de capacidad (CU) se consumen cuando se usa Copilot. Por ejemplo, cuando el usuario usa Copilot para Power BI, Copilot para Data Factoryo Copilot para data Science and Data Engineering.
Operación en la aplicación de métricas | Descripción | Unidad de medida de operación | tasa de consumo |
---|---|---|---|
Copilot en Fabric | Indicación de entrada | Por 1000 tokens | 100 segundos de CU |
Copilot en Fabric | Finalización de la salida | Por 1000 tokens | 400 segundos de CU |
Supervisión del uso
La Aplicación de métricas de capacidad de Fabric muestra el uso total de la capacidad para las operaciones de Copilot bajo el nombre "Copilot en Fabric". Además, los usuarios de Copilot pueden ver un resumen de sus cargos en la facturación por el uso de Copilot en el artículo de facturación "Copilot en Fabric".
Tipo de uso de capacidad
Los copilots de Fabric se clasifican como "trabajos en segundo plano" para controlar un mayor volumen de solicitudes de Copilot durante las horas punta.
Fabric está diseñado para proporcionar un rendimiento rápido al permitir que las operaciones accedan a más recursos de CU (unidades de capacidad) de los asignados a la capacidad. Fabric suaviza o determina el promedio del uso de CU de un "trabajo interactivo" durante un mínimo de 5 minutos y un de "trabajo en segundo plano" durante un período de 24 horas. Según la directiva de limitación de Fabric, la primera fase de limitación comienza cuando una capacidad ha consumido todos sus recursos de CU disponibles, durante los próximos 10 minutos.
Por ejemplo, suponga que cada solicitud de Copilot tiene 2000 tokens de entrada y 500 tokens de salida. El precio de una solicitud de Copilot se calcula de la siguiente manera: (2000 * 100 + 500 * 400) / 1000 = 700 segundos CU = 11,66 minutos CU.
Como Copilot es un trabajo en segundo plano, cada solicitud de Copilot (una tarea de aproximadamente 24 minutos de CU) consume solo un minuto de CU de cada hora de una capacidad. Para un cliente en F64 que tiene 64 x 24 horas de CU (1536) en un día, y cada trabajo de Copilot consume (24 minutos de CU / 60 minutos) = 0,4 horas CU, los clientes pueden ejecutar más de 3800 solicitudes antes de agotar la capacidad. Sin embargo, una vez agotada la capacidad, todas las operaciones se apagarán.
Asignación de regiones
Fabric Copilot cuenta con la tecnología de modelos de lenguaje grande de Azure OpenAI que se implementan actualmente en centros de datos con disponibilidad limitada. Sin embargo, los clientes pueden habilitar las configuraciones de inquilinos entre procesos geográficos para usar Copilots mediante el procesamiento de sus datos en otra región en la que Azure OpenAI Service esté disponible. Esta región podría estar fuera de la región geográfica del usuario, el límite de cumplimiento o la instancia de nube nacional. Al realizar el mapeo de regiones, priorizamos la residencia de datos como la consideración más importante e intentamos asignarla a una región dentro de la misma área geográfica siempre que sea factible.
El costo de las unidades de capacidad de Tejido puede variar en función de la región. Independientemente de la región de consumo en la que se use la capacidad de GPU, los clientes se facturan según los precios de las unidades de capacidad de Fabric en su región de facturación. Por ejemplo, si las solicitudes de un cliente se asignan de region 1
a region 2
, con region 1
como la región de facturación y region 2
como la región de consumo, se le cobra al cliente basándose en los precios de region 1
.
Cambios en la tasa de consumo de Copilot en Fabric
Las tarifas de consumo están sujetas a cambios en cualquier momento. Microsoft usa esfuerzos razonables para proporcionar aviso por correo electrónico o a través de una notificación en el producto. Los cambios serán efectivos en la fecha indicada en las notas de la versión de Microsoft o en el blog de Microsoft Fabric. Si algún cambio en una tasa de consumo de Copilot en Fabric aumenta materialmente las unidades de capacidad (CU) necesarias para usar Copilot en Fabric, los clientes pueden usar las opciones de cancelación disponibles para el método de pago elegido.