Serviço OpenAI do Azure e recursos no Azure Government
Este artigo destaca as diferenças ao usar o Azure OpenAI no Azure Government em comparação com a oferta de nuvem comercial. Se não for especificado, o modelo ou recurso do Azure OpenAI deve ser considerado como não disponível no ambiente do Azure Government. Saiba mais sobre o próprio Serviço OpenAI do Azure na documentação do Serviço OpenAI do Azure.
Modelos do Azure OpenAI
Saiba mais sobre os diferentes recursos de cada modelo nos modelos do Serviço OpenAI do Azure. Para clientes com considerações de continuidade de negócios e recuperação de desastres (BCDR), observe cuidadosamente os tipos de implantação, as regiões e a disponibilidade do modelo, pois nem todas as combinações de modelo/tipo estão disponíveis em ambas as regiões.
As seções a seguir mostram a disponibilidade do modelo por região e tipo de implantação. Os modelos e versões não listados não estão atualmente disponíveis no Azure Government.
Disponibilidade do modelo de implantação padrão
Região | GPT-4O, 2024-05-13 | GPT-4O-Mini, 2024-07-18 | gpt-4, 1106-Pré-visualização | GPT-35-Turbo, 0125 | GPT-35-Turbo, 1106 | incorporação de texto-3-grande, 1 | incorporação de texto-ada-002, 2 |
---|---|---|---|---|---|---|---|
USGOVARIZONA | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ |
USGovVirginia | ✅ | - | ✅ | ✅ | ✅ | - | ✅ |
Para solicitar aumentos de cota para esses modelos, envie uma solicitação em https://aka.ms/AOAIGovQuota. Tenha em atenção os seguintes limites máximos de quota permitidos através desse formulário:
GPT-4O | GPT-4O-Mini | GPT-4 | GPT-35-Turbo | incorporação de texto-3-grande | incorporação de texto-ada-002 |
---|---|---|---|---|---|
300 mil | 600 mil | 200 mil | 500k | 700 mil | 700 mil |
Disponibilidade do modelo de implantação provisionada
Região | GPT-4O, 2024-05-13 | GPT-4O-Mini, 2024-07-18 | gpt-4, 1106-Pré-visualização | GPT-35-Turbo, 0125 | GPT-35-Turbo, 1106 |
---|---|---|---|---|---|
USGOVARIZONA | ✅ | - | - | ✅ | - |
USGovVirginia | ✅ | - | - | ✅ | - |
[OBSERVAÇÃO]
As Unidades de Taxa de Transferência Provisionadas (PTUs) são diferentes da cota padrão no Azure OpenAI e não estão disponíveis por padrão no Azure Government. Para saber mais sobre esta oferta, contacte a sua Equipa de Conta Microsoft.
Recursos do Azure OpenAI
As seguintes diferenças de recursos existem ao comparar o Azure OpenAI no Azure Government vs nuvem comercial.
Funcionalidade | Description |
---|---|
Saídas estruturadas | Não suportado atualmente. |
Compras baseadas em reservas | Não suportado atualmente. |
Implantações em lote | Não suportado atualmente. |
Ligar os seus dados | Rede virtual e links privados são suportados. A implantação em um aplicativo Web ou em um copiloto no Copilot Studio não é suportada. |
Monitorização de Abusos | Nem todos os recursos do Monitoramento de Abuso estão habilitados para o Azure OpenAI no Azure Government. Você é responsável por implementar medidas técnicas e operacionais razoáveis para detetar e mitigar qualquer uso do serviço em violação dos Termos do Produto. A Classificação e Filtragem de Conteúdo Automatizadas permanecem habilitadas por padrão para o Azure Government. Se forem necessários filtros de conteúdo modificados, aplique em https://aka.ms/AOAIGovModifyContentFilter |
Armazenamento de Dados | No Azure Government, não há recursos do Azure OpenAI atualmente habilitados que armazenem dados do cliente em repouso. No entanto, as Chaves Gerenciadas pelo Cliente (CMK) ainda podem ser habilitadas no Azure Government para dar suporte ao uso das mesmas políticas no Azure Government como na nuvem pública. Observe também que, se os recursos do Azure OpenAI que armazenam dados do cliente forem habilitados no Azure Government no futuro, qualquer implantação de CMK existente será aplicada a esses dados naquele momento. Saiba mais em Azure OpenAI Data Privacy. |
Conformidade | Exibir o status atual da conformidade do Azure OpenAI no Azure Government no Escopo de Auditoria dos Serviços Governamentais do Azure |
Pontos Finais de Serviço | openai.azure.us |
Principais portais |
|
Implantações provisionadas no Azure Government
O guia a seguir orienta você na configuração de uma implantação provisionada com seu recurso do Serviço OpenAI do Azure no Azure Government.
Pré-requisitos
- Uma subscrição do Azure Government
- Um recurso do Azure OpenAI
- Uma cota aprovada para uma implantação provisionada e um compromisso adquirido
Gerenciando compromissos de taxa de transferência provisionada
Para o Azure OpenAI no Azure Government, as implantações de taxa de transferência provisionadas exigem compromissos pré-comprados criados e gerenciados a partir do modo de exibição Gerenciar Compromissos no Azure OpenAI Studio. Você pode navegar até essa exibição selecionando Gerenciar compromissos no painel Cota.
Na visualização Gerenciar compromissos, você pode fazer várias coisas:
- Adquira novos compromissos ou edite compromissos existentes.
- Monitorize todos os compromissos na sua subscrição.
- Identifique e tome medidas em relação a compromissos que possam causar faturamento inesperado.
Definição | Notas |
---|---|
Selecione um recurso | Escolha o recurso onde você cria a implantação provisionada. Depois de comprar o compromisso, você não poderá usar a cota em outro recurso até que o compromisso atual expire. |
Selecione um tipo de compromisso | Selecione Provisionado. (Provisionado é equivalente a Provisionado gerenciado) |
Quota provisionada não autorizada atual | O número de PTUs atualmente disponíveis para você se comprometer com este recurso. |
Montante a autorizar (PTU) | Escolha o número de PTUs com as quais você está se comprometendo. Este número pode ser aumentado durante o período de compromisso, mas não pode ser diminuído. Insira valores em incrementos de 50 para o tipo de compromisso Provisionado. |
Nível de compromisso para o período em curso | O período de compromisso é fixado em um mês. |
Configurações de renovação | Renovação automática em PTUs atuais Renovação automática em PTUs mais baixas Não renovar automaticamente |
Importante
Um novo compromisso é cobrado antecipadamente durante todo o prazo. Se as configurações de renovação estiverem definidas para renovação automática, você será cobrado novamente em cada data de renovação com base nas configurações de renovação.
Importante
Quando você adiciona PTUs a um compromisso, elas serão cobradas imediatamente, em um valor proporcional da data atual até o final do prazo de compromisso existente. Adicionar PTUs não redefine o prazo de compromisso.
Alterar as definições de renovação
As configurações de renovação de compromisso podem ser alteradas a qualquer momento antes da data de expiração do seu compromisso.
Importante
Se você permitir que um compromisso expire ou diminua de tamanho de tal forma que as implantações sob o recurso exijam mais PTUs do que você tem em seu compromisso de recurso, você receberá cobranças de excesso de hora por qualquer excesso de PTUs. Por exemplo, um recurso que tenha implantações que totalizam 500 PTUs e um compromisso para 300 PTUs gerará cobranças por hora para 200 PTUs.
Cenários comuns de gestão de compromissos
Descontinuar o uso da taxa de transferência provisionada
Para encerrar o uso da taxa de transferência provisionada e evitar cobranças por hora excessiva após a expiração do compromisso, duas etapas devem ser executadas:
- Defina a política de renovação em todos os compromissos como Não renovar automaticamente.
- Exclua as implantações provisionadas usando a cota.
Mover um compromisso/implantação para um novo recurso na mesma assinatura/região
Não é possível no Azure OpenAI Studio mover diretamente uma implantação ou um compromisso para um novo recurso. Em vez disso, uma nova implantação precisa ser criada no recurso de destino e o tráfego movido para ele. Este processo requer uma nova compra de compromisso no novo recurso. Como os compromissos são cobrados antecipadamente por um período de 30 dias, é necessário cronometrar essa mudança com o vencimento do compromisso original para minimizar a sobreposição com o novo compromisso e a "dupla cobrança" durante a sobreposição.
Há duas abordagens que podem ser tomadas para implementar esta transição.
Opção 1: Transição sem sobreposição
Essa opção requer algum tempo de inatividade, mas não requer cota extra e não gera custos extras.
Passos | Notas |
---|---|
Definir a política de renovação sobre o compromisso existente para expirar | Esta ação impede que o compromisso se renove e gere novos encargos |
Antes de expirar o compromisso existente, exclua sua implantação | O tempo de inatividade começa neste ponto e durará até que a nova implantação seja criada e o tráfego seja movido. Você pode minimizar a duração programando a exclusão para acontecer o mais próximo possível da data/hora de expiração. |
Após a expiração do compromisso existente, crie o compromisso no novo recurso | Minimize o tempo de inatividade executando esta etapa e a próxima etapa o mais rápido possível após a expiração. |
Criar a implantação no novo recurso e mover o tráfego para ele |
Opção 2: Transição sobreposta
Essa opção não tem tempo de inatividade por ter implantações novas e existentes ao mesmo tempo. Esse método também requer ter uma cota disponível para criar a nova implantação e gera custos extras durante as implantações sobrepostas.
Passos | Notas |
---|---|
Definir a política de renovação sobre o compromisso existente para expirar | Isso evita que o compromisso se renove e gere novos encargos. |
Antes do termo do compromisso existente: 1. Crie o compromisso sobre o novo recurso. 2. Crie a nova implantação. 3. Mudar de tráfego 4. Excluir a implantação existente |
Certifique-se de deixar tempo suficiente para todas as etapas antes que o compromisso existente expire, caso contrário, serão geradas cobranças extras (consulte a próxima seção) para opções. |