Copilot no consumo do Fabric
Esta página contém informações sobre como o uso do Fabric Copilot é cobrado e relatado. O uso de Copilot é medido pelo número de tokens processados. Os tokens podem ser considerados como partes de palavras. Aproximadamente 1.000 tokens são cerca de 750 palavras. Os preços são calculados por 1.000 tokens e os tokens de entrada e saída são consumidos a taxas diferentes.
Nota
O Copilot para faturamento do Fabric entrará em vigor em 1º de março de 2024, como parte de sua capacidade existente do Power BI Premium ou Fabric.
Taxa de consumo
Solicitações para Copilot consomem Unidades de Capacidade de Fabric. Esta tabela define quantas unidades de capacidade () são consumidas quando Copilot é usado. Por exemplo, quando o usuário usa Copilot para o Power BI, Copilot para o Data Factoryou Copilot parade Ciência de Dados e Engenharia de Dados.
Operação no Aplicativo de métricas | Descrição | Unidade de Medida de Operação | taxa de consumo |
---|---|---|---|
Copilot no Fabric | O prompt de entrada | A cada 1.000 tokens | 100 segundos de unidade de capacidade |
Copilot no Fabric | A conclusão da saída | A cada 1.000 tokens | 400 segundos de unidade de capacidade |
Monitorar o uso
O aplicativo Fabric Capacity Metrics exibe o uso total da capacidade para operações Copilot sob o nome "Copilot no Fabric". Além disso, usuários do Copilot podem exibir um resumo de seus encargos de cobrança para uso de Copilot no item de faturamento "Copilot no Fabric".
Tipo de utilização de capacidade
Os Copilots do Fabric são classificados como "tarefa em segundo plano" para lidar com um maior volume de solicitações de Copilot durante o horário de pico.
O Fabric foi projetado para fornecer desempenho extremamente rápido, permitindo que as operações acessem mais recursos de Unidades de Capacidade (CU) do que os alocados na capacidade. O Fabric suaviza ou faz a média do uso de CUs de um "trabalho interativo" por um mínimo de 5 minutos e de um "trabalho em segundo plano" durante um período de 24 horas. De acordo com a política de limitação do Fabric, a primeira fase da limitação começa quando uma capacidade consumiu todos os seus recursos de CU disponíveis para os próximos 10 minutos.
Por exemplo, suponha que cada solicitação Copilot tenha 2.000 tokens de entrada e 500 tokens de saída. O preço de uma solicitação Copilot é calculado da seguinte maneira: (2.000 * 100 + 500 * 400) / 1.000 = 700 segundos = 11,66 minutos.
Como Copilot é um trabalho em segundo plano, cada solicitação Copilot (trabalho que consome aproximadamente 24 minutos de CU) utiliza apenas um minuto de CU a cada hora de capacidade. Para um cliente em F64 que tem 64 * 24 horas de CU (1.536) em um dia, e cada trabalho Copilot consome (24 minutos de CU / 60 minutos) = 0,4 Horas de CU, os clientes podem executar mais de 3.800 solicitações antes de esgotar a capacidade. No entanto, depois que a capacidade for esgotada, todas as operações serão desligadas.
Mapeamento de região
O Copilot do Fabric é alimentado por modelos de linguagem de grande porte do OpenAI do Azure que atualmente são implantados em data centers limitados. No entanto, os clientes podem habilitar configurações de locatário para processamento entre regiões geográficas para usar Copilots ao processar os dados deles em outra região onde o Serviço OpenAI do Azure está disponível. Essa região pode estar fora da região geográfica do usuário, do limite de conformidade ou da instância de nuvem nacional. Ao executar o mapeamento de região, priorizamos a residência de dados como a principal consideração e tentamos mapear para uma região dentro da mesma área geográfica sempre que possível.
O custo das Unidades de Capacidade do Fabric pode variar dependendo da região. Independentemente da região de consumo em que a capacidade de GPU é utilizada, os clientes são cobrados com base nos preços das Unidades de Capacidade do Fabric em sua região de cobrança. Por exemplo, se as solicitações de um cliente forem mapeadas de region 1
para region 2
, com region 1
sendo a região de cobrança e region 2
sendo a região de consumo, o cliente será cobrado com base nos preços em region 1
.
Alterações no Copilot na taxa de consumo do Fabric
As taxas de consumo estão sujeitas a alterações a qualquer momento. A Microsoft usa esforços razoáveis para fornecer aviso por email ou por meio de notificação no produto. As alterações devem entrar em vigor na data declarada nas Notas de Versão da Microsoft ou no Blog do Microsoft Fabric. Se qualquer alteração em um Copilot na Taxa de Consumo do Fabric aumentar materialmente as CUs (Unidades de Capacidade) necessárias para usar Copilot no Fabric, os clientes poderão usar as opções de cancelamento disponíveis para a forma de pagamento escolhida.