Partilhar via


Atualização de agosto de 2024 provisionada do Azure OpenAI

Em meados de agosto de 2024, a Microsoft lançou melhorias em sua oferta de taxa de transferência provisionada que abordam o feedback dos clientes sobre usabilidade e agilidade operacional que abrem novas opções de pagamento e cenários de implantação.

Este artigo destina-se a usuários existentes da oferta de taxa de transferência provisionada. Os novos clientes devem consultar o guia de integração provisionada do Azure OpenAI.

O que está a mudar?

Os recursos abaixo estão sendo implementados para a oferta Provisioned Managed.

Importante

As alterações neste artigo não se aplicam à oferta mais antiga "Provisioned Classic (PTU-C)". Eles afetam apenas a oferta Provisionada (também conhecida como Provisionada Gerenciada).

Melhorias de usabilidade

Caraterística Benefício
Quota independente do modelo Um limite de quota único que abranja todos os modelos/versões reduz a administração de quotas e acelera a experimentação de novos modelos.
Solicitações de cota de autoatendimento Solicite aumentos de cota sem envolver a equipe de vendas – muitos podem ser aprovados automaticamente.
Cota gerenciada provisionada padrão em muitas regiões Comece rapidamente sem ter que solicitar primeiro uma cota.
Informações transparentes sobre disponibilidade de capacidade em tempo real + Novo fluxo de implantação A negociação reduzida em torno da disponibilidade acelera o time-to-market.

Novo modelo comercial por hora/reserva

Caraterística Benefício
Utilização horária e não confirmada A opção de pagamento por hora sem um compromisso necessário permite cenários de implantação de curto prazo.
Descontos por prazo através das Reservas do Azure As reservas do Azure fornecem descontos substanciais sobre a taxa horária por períodos de um mês e um ano e fornecem escopos flexíveis que minimizam a administração e associados aos compromissos atuais vinculados a recursos.
Cota gerenciada provisionada padrão em muitas regiões Comece rapidamente em novas regiões sem ter que solicitar primeiro uma cota.
Escolha flexível do modelo de pagamento para clientes provisionados existentes Os clientes com compromissos podem permanecer no modelo de compromisso pelo menos até o final de 2024 e podem optar por migrar os compromissos existentes para horários/reservas por meio de um processo de autoatendimento ou gerenciado.
Suporta as últimas gerações de modelos O modelo por hora/reserva é necessário para implantar modelos lançados após 1º de agosto de 2024.

Detalhes de melhoria de usabilidade

A granularidade da cota provisionada está mudando de específica do modelo para independente do modelo. Em vez de cada modelo e versão dentro da assinatura e região ter seu próprio limite de cota, há um único item de cota por assinatura e região que limita o número total de PTUs que podem ser implantadas em todos os modelos e versões suportados.

Quota independente do modelo

A partir de 12 de agosto de 2024, a cota atual e específica do modelo dos clientes existentes foi convertida para independente do modelo. Isso acontece automaticamente. Nenhuma quota é perdida na transição. Os limites de cota existentes são somados e atribuídos a um novo item de cota independente do modelo.

Diagrama mostrando a consolidação de cotas.

A nova cota independente de modelo aparece como um item de cota chamado Unidade de Taxa de Transferência Gerenciada Provisionada, com modelo e versão não mais incluídos no nome. No painel Cota do Studio, a expansão do item de cota ainda mostra todas as implantações que contribuem para o item de cota.

Quota por defeito

Às subscrições novas e existentes é atribuída uma pequena quantidade de quota provisionada em muitas regiões. Isso permite que os clientes comecem a usar essas regiões sem ter que solicitar primeiro uma cota.

Para clientes existentes, se a região já contiver uma atribuição de cota, o limite de cota não será alterado para a região. Por exemplo, ele não é aumentado automaticamente pelo novo valor padrão.

Solicitações de cota de autoatendimento

Os clientes deixam de obter quotas contactando as suas equipas de vendas. Em vez disso, eles usam o formulário de solicitação de cota de autoatendimento e especificam o tipo de cota gerenciada por PTU. O formulário pode ser acessado a partir de um link à direita do item de cota. O objetivo é responder a todos os pedidos de quota no prazo de dois dias úteis.

A captura de tela de cota a seguir mostra a cota independente do modelo sendo usada por implantações de diferentes tipos, bem como o link para solicitar cota adicional.

Captura de tela da nova interface do usuário do tipo de solicitação para Azure OpenAI provisionada para solicitar mais cota.

Quota como limite

Antes da atualização de agosto, o Azure OpenAI Provisioned estava disponível apenas para alguns clientes e a cota foi alocada para maximizar a capacidade de implantação e uso do Azure. Com essas alterações, o processo de aquisição de cota é simplificado para todos os usuários e há uma maior probabilidade de esbarrar em limitações de capacidade de serviço quando as implantações são tentadas. Uma nova experiência de API e Studio está disponível para ajudar os usuários a encontrar regiões onde a assinatura tem cota e o serviço tem capacidade para suportar implantações de um modelo desejado.

Também recomendamos que os clientes que usam compromissos agora criem suas implantações antes de criar ou expandir compromissos para cobri-los. Isto garante que a capacidade está disponível antes de criar um compromisso e evita a compra excessiva do compromisso. Para apoiar isso, a restrição que impedia que implantações fossem criadas maiores do que seus compromissos foi removida. Essa nova abordagem para cota, disponibilidade de capacidade e compromissos corresponde ao que é fornecido no modelo horário/reserva, e a orientação a ser implantada antes de comprar um compromisso (ou reserva, para o modelo horário) é a mesma para ambos.

Consulte as ligações seguintes para mais informações. As orientações para reservas e compromissos são as mesmas:

Novo modelo de pagamento de reserva por hora

Nota

A seguinte descrição dos modelos de pagamento não se aplica à oferta mais antiga "Provisioned Classic (PTU-C)". Eles afetam apenas a oferta Provisionada (também conhecida como Provisionada Gerenciada). O Provisioned Classic continua a ser regido pelo modelo de pagamento de compromisso mensal inalterado.

A Microsoft introduziu um novo modelo de pagamento "por hora/reserva" para implantações provisionadas. Este valor acresce ao atual modelo de pagamento de compromissos , que continuará a ser apoiado pelo menos até ao final de 2024.

Modelo de pagamento de compromisso

  • É necessário um compromisso regional e mensal para utilizar provisionados (prazos mais longos disponíveis contratualmente).

  • Os compromissos estão vinculados aos recursos do Azure OpenAI, o que dificulta a movimentação de implantações entre recursos.

  • Os compromissos não podem ser cancelados ou alterados durante a sua vigência, exceto para adicionar novas PTUs.

  • Suporta modelos lançados antes de 1 de agosto de 2024.

Modelo de pagamento de reserva por hora

  • O modelo de pagamento está alinhado com os padrões do Azure para outros produtos.

  • O uso por hora é suportado, sem compromisso.

  • Os descontos de um mês e um ano podem ser adquiridos como Reservas regionais do Azure.

  • As reservas podem ter um escopo flexível para cobrir várias assinaturas, e o escopo pode ser alterado no meio do prazo.

  • Suporta todos os modelos, antigos e novos.

Importante

Os modelos lançados após 1º de agosto de 2024 exigem o uso do modelo de pagamento por hora/reserva. Eles não podem ser implantados em recursos do Azure OpenAI que tenham compromissos ativos. Para implantar modelos lançados após 1º de agosto, os clientes existentes devem:

  • Crie implantações em recursos do Azure OpenAI sem compromissos.
  • Migre um recurso existente de seus compromissos.

Quadro do modelo de pagamento

Com o lançamento do modelo de pagamento por hora/reservado, as opções de pagamento são mais flexíveis e o modelo em torno dos pagamentos provisionados mudou. Quando os compromissos de um mês eram a única forma de comprar provisionado, o modelo era:

  1. Obtenha uma quota PTU da sua equipa de conta Microsoft.
  2. Cota de "compra" a partir de um compromisso no recurso onde você deseja implantar.
  3. Crie implantações no recurso até o limite do compromisso.

A principal diferença entre este modelo e o novo modelo é que, anteriormente, a única forma de pagar o provisionado era através de um desconto de um mês. Agora, você pode implantar e pagar por implantações por hora se escolher e tomar uma decisão separada sobre descontá-las por meio de um compromisso de um mês (como antes) ou de uma reserva do Azure.

Com essa perceção, a nova maneira de pensar em modelos de pagamento é a seguinte:

  1. Obtenha uma cota de PTU usando o formulário de autoatendimento.
  2. Crie implantações usando sua cota.
  3. Opcionalmente, adquira ou estenda um compromisso ou uma reserva para aplicar um desconto de prazo às suas implantações.

Os passos 1 e 2 são os mesmos em todos os casos. A diferença é se um compromisso ou uma reserva do Azure é usada como o veículo para fornecer o desconto. Em ambos os modelos:

  • É possível implantar mais PTUs do que você desconta. (por exemplo, a criação de uma implantação de curto prazo para experimentar um novo modelo é habilitada implantando sem comprar um desconto)

  • O método de desconto (compromisso ou reserva) aplica o preço descontado a um número fixo de PTUs e tem um escopo que define quais implantações são contadas em relação ao desconto.

    Tipo de desconto Escopos disponíveis (dentro de uma região)
    Alocação Recurso do Azure OpenAI
    Linha2 Grupo de recursos, assinatura única, grupo de gerenciamento (grupo de assinaturas), compartilhado (todas as assinaturas em uma conta de cobrança)
  • O preço com desconto é aplicado a PTUs implantadas até o número de PTUs com desconto no desconto.

  • O número de PTUs implantadas que excedem as PTUs com desconto (ou não cobertas por qualquer desconto) é cobrado a taxa horária.

  • A prática recomendada é criar implantações primeiro e, em seguida, aplicar descontos. Isto é para garantir esse serviço. A capacidade está disponível para dar suporte às suas implantações antes de criar um compromisso de prazo para PTUs que você não pode usar.

Nota

Ao seguir as práticas recomendadas, você pode receber cobranças por hora entre o momento em que cria a implantação e aumenta seu desconto (compromisso ou reserva).

Por esse motivo, recomendamos que você esteja preparado para aumentar seu desconto imediatamente após a implantação. Os pré-requisitos para comprar uma reserva do Azure são diferentes dos compromissos, e recomendamos que você os valide antes da implantação se pretender usá-los para descontar sua implantação. Para obter mais informações, consulte Permissões para exibir e gerenciar reservas do Azure

Mapeando implantações para o método de desconto

Os clientes que usam o Azure OpenAI Provisioned antes de agosto de 2024 podem usar um ou ambos os modelos de pagamento simultaneamente em uma assinatura. O modelo de pagamento usado para cada implantação é determinado com base em seu recurso Azure OpenAI:

A Resource tem um Compromisso ativo

  • O compromisso desconta todas as implantações no recurso até o número de PTUs no compromisso. Qualquer excesso de PTUs será cobrado por hora.

O recurso não tem um compromisso ativo

  • As implantações sob o recurso são qualificadas para serem descontadas por uma reserva do Azure. Para que essas implantações sejam descontadas, elas devem existir dentro do escopo de uma reserva ativa. Todas as implantações dentro do escopo da reserva (incluindo possivelmente implantações em outros recursos na mesma ou em outras assinaturas) serão descontadas como um grupo até o número de PTUs na reserva. Qualquer excesso de PTUs será cobrado por hora.

Alterações ao modo de pagamento existente

Os clientes que têm compromissos hoje podem continuar a usá-los pelo menos até o final de 2024. Isso inclui a compra de novas PTUs em compromissos novos ou existentes e o gerenciamento de comportamentos de renovação de compromissos. No entanto, a atualização de agosto alterou certos aspetos do funcionamento do compromisso.

  • Somente modelos lançados como provisionados antes de 1º de agosto de 2024 ou antes podem ser implantados em um recurso com compromisso.

  • Se as PTUs implantadas sob um compromisso excederem as PTUs comprometidas, as cobranças por excesso de hora serão emitidas em relação ao mesmo medidor horário usado para o novo modelo de pagamento por hora/reserva. Isso permite que as cobranças por excesso de idade sejam descontadas por meio de uma Reserva do Azure.

  • É possível implantar mais PTUs do que as comprometidas no recurso. Isso apoia a capacidade de garantir a disponibilidade de capacidade antes de aumentar o tamanho do compromisso para cobri-la.

Migração de recursos existentes de compromissos

Os clientes existentes podem optar por migrar seus recursos existentes do modelo de pagamento Compromisso por hora/reserva para se beneficiar da capacidade de implantar os modelos mais recentes ou consolidar descontos para diversas implantações em uma única reserva.

Duas abordagens estão disponíveis para os clientes migrarem recursos usando o modelo de compromisso para o modelo de hora/reserva.

Migração de autoatendimento

A abordagem de migração de autosserviço permite que um cliente retire organicamente recursos de seus compromissos, permitindo que eles expirem. O processo para migrar um recurso é o seguinte:

  • Defina o compromisso existente para não renovar automaticamente e anote a data de validade.

  • Antes da data de expiração, um cliente deve comprar uma Reserva do Azure que cubra o número total de PTUs confirmadas por assinatura. Se uma reserva existente já tiver a subscrição no seu âmbito, esta pode ser aumentada para cobrir as novas PTU.

  • Quando o compromisso expirar, as implantações sob o recurso mudarão automaticamente para o modo Horária/Reserva com o uso descontado pela reserva.

Essa abordagem de migração de autoatendimento resultará em uma sobreposição em que a reserva e o compromisso estão ativos. Esta é uma característica deste modo de migração e o tempo de reserva ou compromisso para esta sobreposição não será creditado de volta ao cliente.

Uma abordagem alternativa para a migração de autoatendimento é mudar a compra da reserva para ocorrer após o vencimento do compromisso. Nessa abordagem, as implantações gerarão uso por hora para o período entre o vencimento do compromisso e a compra da reserva. Tal como no modelo anterior, esta é uma característica desta abordagem, e esta utilização horária não será creditada.

Vantagens da migração de autoatendimento:

  • Os recursos individuais podem ser migrados em momentos diferentes.
  • Os clientes gerenciam a migração sem dependências da Microsoft.

Desvantagens da migração de autoatendimento:

  • Haverá um curto período de dupla faturação ou encargos horários durante a transição da faturação confirmada para a faturação horária/reserva.

Importante

Ambas as abordagens de autoatendimento geram alguns encargos adicionais, pois o modo de pagamento é mudado de Comprometido para Horário/Reserva. Essas são características das abordagens de migração e os clientes não são creditados por essas cobranças. Os clientes podem optar por usar a abordagem de migração gerenciada descrita abaixo para evitá-los.

Migração gerenciada

A abordagem de migração gerenciada envolve a parceria do cliente com a Microsoft para migrar em massa todos os compromissos de PTU em uma assinatura/região ao mesmo tempo. Funciona da seguinte forma:

  1. O cliente envolverá sua equipe de conta e solicitará uma migração gerenciada. Um proprietário de migração da equipe da Microsoft será designado para ajudar o cliente com a migração.
  2. Será selecionada uma data em que todos os recursos dentro de cada uma das assinaturas e regiões dos clientes que contêm compromissos atuais de PTU serão migrados do modelo de cobrança confirmada para o modelo de cobrança por hora/reserva. Várias assinaturas e regiões podem ser migradas na mesma data.
  3. Na data acordada:
    • O cliente comprará reservas regionais para cobrir as PTUs comprometidas que serão convertidas e passará as informações de reserva para seu contato de migração da Microsoft.
    • Dentro de 2-3 dias úteis, todos os compromissos serão cancelados proativamente e as implantações anteriormente sob compromissos começarão a usar o modelo de pagamento por hora/reserva.
    • No período de faturação posterior àquele com a compra da reserva, o cliente receberá um crédito pela compra da reserva abrangendo as parcelas dos compromissos que foram cancelados, a partir do momento da compra da reserva.

Os clientes devem entrar em contato com suas equipes de conta para agendar uma migração gerenciada.

Vantagens da migração gerenciada:

  • A migração em massa de todos os compromissos em uma assinatura/região é benéfica para clientes com muitos compromissos.
  • Migração de custos sem interrupções: Sem possibilidade de cobrança dupla ou cobranças horárias extras.

Desvantagens da migração gerenciada:

  • Todos os compromissos em uma assinatura/região devem ser migrados ao mesmo tempo.
  • Necessidade de coordenar um tempo para a migração com a equipe da Microsoft.

Gerenciando compromissos de taxa de transferência provisionada

Os compromissos de taxa de transferência provisionados são criados e gerenciados no menu Gerenciar compromissos no Azure OpenAI Studio. Você pode navegar até essa exibição selecionando Gerenciar compromissos no menu Cota:

Captura de tela da interface do usuário de compra de compromisso com notificações.

Na visualização Gerenciar compromissos , você pode fazer várias coisas:

  • Adquira novos compromissos ou edite compromissos existentes.
  • Monitorize todos os compromissos na sua subscrição.
  • Identifique e tome medidas em relação a compromissos que possam causar faturamento inesperado.

As secções seguintes irão guiá-lo através destas tarefas.

Adquira um compromisso de taxa de transferência provisionada

Com o seu plano de compromisso pronto, o próximo passo é criar os compromissos. Os compromissos são criados manualmente por meio do Azure OpenAI Studio e exigem que o usuário que cria o compromisso tenha a função de Colaborador ou Colaborador de Serviços Cognitivos no nível da assinatura.

Para cada novo compromisso que você precisa criar, siga estas etapas:

  1. Inicie a caixa de diálogo de compra de Taxa de Transferência Provisionada selecionando Planos de Compromisso> de Gerenciamento Provisionado>do Azure OpenAI do Azure.

Captura de tela da caixa de diálogo de compra.

  1. Selecione Compromisso de compra.

  2. Selecione o recurso Azure OpenAI e adquira o compromisso. Você verá seus recursos divididos em recursos com compromissos existentes, que você pode editar e recursos que não têm um compromisso no momento.

Definição Notas
Selecione um recurso Escolha o recurso onde você criará a implantação provisionada. Depois de ter comprado o compromisso, você não poderá usar as PTUs em outro recurso até que o compromisso atual expire.
Selecione um tipo de compromisso Selecione Provisionado. (Provisionado é equivalente a Provisionado gerenciado)
Quota provisionada não autorizada atual O número de PTUs atualmente disponíveis para você se comprometer com este recurso.
Montante a autorizar (PTU) Escolha o número de PTUs com as quais você está se comprometendo. Este número pode ser aumentado durante o período de compromisso, mas não pode ser diminuído. Insira valores em incrementos de 50 para o tipo de compromisso Provisionado.
Nível de compromisso para o período em curso O período de compromisso é fixado em um mês.
Configurações de renovação Renovação automática em PTUs atuais
Renovação automática em PTUs mais baixas
Não renovar automaticamente
  1. Selecione Comprar. Será exibida uma caixa de diálogo de confirmação. Depois de confirmar, suas PTUs serão confirmadas e você poderá usá-las para criar uma implantação provisionada. |

Captura de tela da interface do usuário de compra de compromisso.

Importante

Um novo compromisso é cobrado antecipadamente durante todo o prazo. Se as configurações de renovação estiverem definidas para renovação automática, você será cobrado novamente em cada data de renovação com base nas configurações de renovação.

Editar um compromisso de taxa de transferência provisionada existente

Na visualização Gerenciar compromissos, você também pode editar um compromisso existente. Há dois tipos de alterações que você pode fazer em um compromisso existente:

  • Você pode adicionar PTUs ao compromisso.
  • Você pode alterar as configurações de renovação.

Para editar um compromisso, selecione o atual a ser editado e, em seguida, selecione Editar compromisso.

Adicionando unidades de taxa de transferência provisionada aos compromissos existentes

Adicionar PTUs a um compromisso existente permitirá que você crie implantações maiores ou mais numerosas dentro do recurso. Pode fazê-lo a qualquer momento durante a vigência do seu compromisso.

Captura de tela da interface do usuário de compra de compromisso com um aumento no valor a ser confirmado.

Importante

Quando você adiciona PTUs a um compromisso, elas serão cobradas imediatamente, em um valor proporcional da data atual até o final do prazo de compromisso existente. Adicionar PTUs não redefine o prazo de compromisso.

Alterar as definições de renovação

As configurações de renovação de compromisso podem ser alteradas a qualquer momento antes da data de expiração do seu compromisso. Os motivos pelos quais você pode querer alterar as configurações de renovação incluem encerrar o uso da taxa de transferência provisionada definindo o compromisso de não renovar automaticamente ou diminuir o uso da taxa de transferência provisionada reduzindo o número de PTUs que serão confirmadas no próximo período.

Importante

Se você permitir que um compromisso expire ou diminua de tamanho de tal forma que as implantações sob o recurso exijam mais PTUs do que você tem em seu compromisso de recurso, você receberá cobranças de excesso de hora por qualquer excesso de PTUs. Por exemplo, um recurso que tenha implantações que totalizam 500 PTUs e um compromisso para 300 PTUs gerará cobranças por hora para 200 PTUs.

Monitore compromissos e evite cobranças inesperadas

O painel gerenciar compromissos fornece uma visão geral ampla da assinatura de todos os recursos com compromissos e uso de PTU em uma determinada Assinatura do Azure. Revestem-se de especial importância:

  • PTUs Comprometidas, Implantadas e Usadas – Esses números fornecem o tamanho de seus compromissos e quanto está em uso pelas implantações. Maximize seu investimento usando todas as suas PTUs comprometidas.
  • Política e data de expiração - A data de expiração e a política informam quando um compromisso expirará e o que acontecerá quando isso acontecer. Um compromisso definido para renovação automática gerará um evento de faturamento na data de renovação. Para compromissos que estão expirando, certifique-se de excluir implantações desses recursos antes da data de expiração para evitar cobrança excessiva por horaAs configurações de renovação atuais de um compromisso.
  • Notificações - Alertas sobre condições importantes, como compromissos não utilizados e configurações que podem resultar em excessos de faturamento. Os excessos de faturamento podem ser causados por situações como quando um compromisso expirou e as implantações ainda estão presentes, mas mudaram para o faturamento por hora.

Cenários comuns de gerenciamento de compromisso

Descontinuar o uso da taxa de transferência provisionada

Para encerrar o uso da taxa de transferência provisionada e evitar cobranças por hora excessiva após a expiração do compromisso, interromper quaisquer cobranças depois que os compromissos atuais expirarem, duas etapas devem ser executadas:

  1. Defina a política de renovação em todos os compromissos como Não renovar automaticamente.
  2. Exclua as implantações provisionadas usando a cota.

Mover um compromisso/implantação para um novo recurso na mesma assinatura/região

Não é possível no Azure OpenAI Studio mover diretamente uma implantação ou um compromisso para um novo recurso. Em vez disso, uma nova implantação precisa ser criada no recurso de destino e o tráfego movido para ele. Terá de haver um compromisso adquirido estabelecido sobre o novo recurso para o conseguir. Como os compromissos são cobrados antecipadamente por um período de 30 dias, é necessário cronometrar essa mudança com o vencimento do compromisso original para minimizar a sobreposição com o novo compromisso e a "dupla cobrança" durante a sobreposição.

Há duas abordagens que podem ser tomadas para implementar esta transição.

Opção 1: Transição sem sobreposição

Essa opção requer algum tempo de inatividade, mas não requer cota extra e não gera custos extras.

Passos Notas
Definir a política de renovação sobre o compromisso existente para expirar Tal impedirá a renovação do compromisso e a criação de novos encargos
Antes de expirar o compromisso existente, exclua sua implantação O tempo de inatividade começará neste ponto e durará até que a nova implantação seja criada e o tráfego seja movido. Você minimizará a duração programando a exclusão para acontecer o mais próximo possível da data/hora de expiração.
Após a expiração do compromisso existente, crie o compromisso no novo recurso Minimize o tempo de inatividade executando esta e a próxima etapa o mais rápido possível após a expiração.
Criar a implantação no novo recurso e mover o tráfego para ele

Opção 2: Transição sobreposta

Essa opção não tem tempo de inatividade por ter implantações novas e existentes ao mesmo tempo. Isso requer ter uma cota disponível para criar a nova implantação e gerará custos extras durante a duração das implantações sobrepostas.

Passos Notas
Definir a política de renovação sobre o compromisso existente para expirar Isso evita que o compromisso se renove e gere novos encargos.
Antes do termo do compromisso existente:
1. Crie o compromisso sobre o novo recurso.
2. Crie a nova implantação.
3. Mudar de tráfego
4. Excluir a implantação existente
Certifique-se de deixar tempo suficiente para todas as etapas antes que o compromisso existente expire, caso contrário, serão geradas cobranças extras (consulte a próxima seção) para opções.

Se a etapa final demorar mais do que o esperado e terminar depois que o compromisso existente expirar, há três opções para minimizar as cobranças por excesso.

  • Tempo de inatividade: exclua a implantação original e conclua a movimentação.
  • Excesso de pagamento: mantenha a implantação original e pague por hora até que você tenha removido o tráfego e excluído a implantação.
  • Redefina o compromisso original para renovar mais uma vez. Isso lhe dará tempo para concluir a mudança com um custo conhecido.

Tanto o pagamento de um excesso quanto a redefinição do compromisso original gerarão cobranças além da data de vencimento original. Pagar taxas extras pode ser mais barato do que um novo compromisso de um mês se você precisar apenas de um ou dois dias para concluir a mudança. Compare os custos de ambas as opções para encontrar a abordagem de menor custo.

Mover a implantação para uma nova região e/ou assinatura

As mesmas abordagens se aplicam na mudança do compromisso e implantação dentro da região, exceto que ter cota disponível no novo local será exigido em todos os casos.

Ver e editar um recurso existente

No Azure OpenAI Studio, selecione Compromissos de gerenciamento provisionado>de cota>e selecione um recurso com um compromisso existente para exibi-lo/alterá-lo.