Copilot no consumo de tecidos
Esta página contém informações sobre como o uso do tecido Copilot é faturado e relatado. O uso de Copilot é medido pelo número de tokens processados. Os tokens podem ser pensados como pedaços de palavras. Aproximadamente 1.000 tokens são cerca de 750 palavras. Os preços são calculados por 1.000 tokens, e os tokens de entrada e saída são consumidos em taxas diferentes.
Observação
O Copilot para faturamento do Fabric entrará em vigor em 1 de março de 2024, como parte da sua capacidade existente do Power BI Premium ou do Fabric.
Taxa de consumo
Solicitações para Copilot consomem Unidades de Capacidade de Estrutura. Esta tabela define quantas unidades de capacidade () são consumidas quando Copilot é usada. Por exemplo, quando o usuário usa Copilot para o Power BI, Copilot para o Data Factoryou Copilot para Ciência de Dados e Engenharia de Dados.
Operação no aplicativo Metrics | Descrição | Unidade Operacional de Medida | Taxa de consumo |
---|---|---|---|
Copilot em tecido | O prompt de entrada | Por 1.000 tokens | 100 segundos CU |
Copilot em tecido | O resultado final | Por 1.000 tokens | 400 segundos CU |
Monitorizar a utilização
A aplicação Fabric Capacity Metrics exibe o uso total de capacidade para operações de Copilot com o nome "Copilot na malha". Além disso, Copilot utilizadores podem visualizar um resumo das suas cobranças de Copilot uso sob o item de faturação "Copilot na malha".
Tipo de utilização da capacidade
Os Fabric Copilots são classificados como "trabalhos em segundo plano" para lidar com um volume maior de pedidos de Copilot durante o horário de pico.
A malha foi projetada para fornecer um desempenho extremamente rápido, permitindo que as operações acessem mais recursos de (Unidades de Capacidade) do que os alocados à capacidade. O tecido suaviza ou calcula a média do uso de um "trabalho interativo" por um mínimo de 5 minutos e de um "trabalho em segundo plano" durante um período de 24 horas. De acordo com a política de limitação de malha, a primeira fase de limitação começa quando uma capacidade consumiu todos os seus recursos de UC disponíveis para os próximos 10 minutos.
Por exemplo, suponha que cada solicitação de Copilot tenha 2.000 tokens de entrada e 500 tokens de saída. O preço de uma solicitação Copilot é calculado da seguinte forma: (2.000 * 100 + 500 * 400) / 1.000 = 700 segundos = 11,66 minutos.
Como Copilot é um trabalho em segundo plano, cada solicitação de Copilot (trabalho de aproximadamente 24 minutos CU) consome apenas um minuto CU de cada hora de uma capacidade. Para um cliente em F64 que tem 64 * 24 Horas CU (1.536) num dia, e cada trabalho Copilot consome (24 mins CU / 60 mins) = 0,4 Horas CU, os clientes podem executar mais de 3.800 requisições antes de esgotar a capacidade. No entanto, uma vez esgotada a capacidade, todas as operações serão encerradas.
Mapeamento de regiões
O Fabric Copilot é suportado por grandes modelos de linguagem do Azure OpenAI que estão atualmente implantados em centros de dados limitados. No entanto, os clientes podem habilitar as configurações de locatário de processo entre-regiões para usar o Copilots ao processar seus dados em outra região onde o Serviço OpenAI do Azure se disponibiliza. Essa região pode estar fora da região geográfica do usuário, do limite de conformidade ou da instância de nuvem nacional. Ao realizar o mapeamento de região, priorizamos a residência de dados como a principal consideração e tentamos mapear para uma região dentro da mesma área geográfica sempre que possível.
O custo das Unidades de Capacidade de Tecido pode variar dependendo da região. Independentemente da região de consumo onde a capacidade da GPU é utilizada, os clientes são cobrados com base no preço das Unidades de Capacidade de Malha em sua região de faturamento. Por exemplo, se as solicitações de um cliente forem mapeadas de region 1
para region 2
, sendo region 1
a região de faturamento e region 2
a região de consumo, o cliente será cobrado com base no preço em region 1
.
Alterações no Copilot na taxa de consumo de tecidos
As taxas de consumo estão sujeitas a alterações a qualquer momento. A Microsoft envida todos os esforços razoáveis para fornecer um aviso por correio eletrónico ou através de notificação no produto. As alterações entrarão em vigor na data indicada nas Notas de Versão da Microsoft ou no Blog do Microsoft Fabric. Se qualquer alteração em um Copilot na Taxa de Consumo de Malha aumentar materialmente as Unidades de Capacidade (UC) necessárias para usar Copilot na Malha, os clientes poderão usar as opções de cancelamento disponíveis para o método de pagamento escolhido.