Perfis de carga de trabalho em Aplicativos de Contêiner do Azure
Um perfil de carga de trabalho determina a quantidade de recursos de computação e memória disponíveis para os aplicativos de contêiner implantados em um ambiente.
Os perfis são configurados para atender às diferentes necessidades de seus aplicativos.
Tipo de perfil | Descrição | Uso potencial |
---|---|---|
Consumo | Adicionado automaticamente a qualquer novo ambiente. | Aplicativos que não exigem requisitos de hardware específicos |
Dedicado (Uso geral) | Equilíbrio de memória e recursos computacionais | Aplicativos que exigem maiores quantidades de CPU e/ou memória |
Dedicado (Memória otimizada) | Aumento dos recursos de memória | Aplicativos que precisam de acesso a grandes dados na memória, modelos de aprendizado de máquina na memória ou outros requisitos de memória elevados |
Dedicado (habilitado para GPU) (visualização) | GPU habilitada com mais memória e recursos de computação disponíveis nas regiões Oeste dos EUA 3 e Norte da Europa. | Aplicativos que exigem GPU |
Observação
Ao usar perfis de carga de trabalho habilitados para GPU, certifique-se de que o aplicativo esteja executando a versão mais recente do CUDA.
O perfil de carga de trabalho de Consumo é o perfil padrão adicionado a cada tipo de perfil de ambiente de área de trabalho. Você pode adicionar perfis de carga de trabalho dedicados ao seu ambiente ao criá-lo ou depois de criá-lo. Os ambientes de perfis de carga de trabalho são implantados separadamente dos ambientes somente consumo.
Para cada perfil de carga de trabalho dedicada em seu ambiente, você pode:
- Selecionar o tipo e o tamanho
- Implantar vários aplicativos no perfil
- Usar o dimensionamento automático para adicionar e remover instâncias com base nas necessidades dos aplicativos
- Limitar o dimensionamento do perfil para controlar melhor os custos
Você pode configurar cada um dos seus aplicativos para ser executado em qualquer um dos perfis de carga de trabalho definidos em seu ambiente de Aplicativos de Contêiner. Essa configuração é ideal para implantar microsserviços em que cada aplicativo pode ser executado na infraestrutura de computação apropriada.
Observação
Você só pode aplicar um perfil de carga de trabalho de GPU a um ambiente à medida que o ambiente é criado.
Tipos de perfil
Há diferentes tipos e tamanhos de perfis de carga de trabalho disponíveis por região. Por padrão, cada plano Dedicado inclui um perfil de consumo, mas você também pode adicionar qualquer um dos seguintes perfis:
Nome de exibição | Nome | vCPU | Memória (GiB) | GPU | Categoria | Alocação |
---|---|---|---|---|---|---|
Consumo | Consumo | 4 | 8 | - | Consumo | por réplica |
Consumption-GPU-NC24-A100 (versão prévia) | GPU de consumo | 24 | 220 | 1 | Consumo | por réplica |
Consumption-GPU-NC8as-T4 (versão prévia) | GPU de consumo | 8 | 56 | 1 | Consumo | por réplica |
Dedicado-D4 | D4 | 4 | 16 | - | Propósito geral | por nó |
Dedicado-D8 | D8 | 8 | 32 | - | Propósito geral | por nó |
Dedicado-D16 | D16 | 16 | 64 | - | Propósito geral | por nó |
Dedicado-D32 | D32 | 32 | 128 | - | Propósito geral | por nó |
Dedicado-D4 | E4 | 4 | 32 | - | Memória otimizada | por nó |
Dedicado-D8 | E8 | 8 | 64 | - | Memória otimizada | por nó |
Dedicado-E16 | E16 | 16 | 128 | - | Memória otimizada | por nó |
Dedicado-E32 | E32 | 32 | 256 | - | Memória otimizada | por nó |
Dedicado-NC24-A100 (visualização) | NC24-A100 | 24 | 220 | 1 | Habilitado para GPU | por nó* |
Dedicado-NC48-A100 (visualização) | NC48-A100 | 48 | 440 | 2 | Habilitado para GPU | por nó* |
Dedicado-NC96-A100 (visualização) | NC96-A100 | 96 | 880 | 4 | Habilitado para GPU | por nó* |
* A capacidade é alocada caso a caso. Envie um tíquete de suporte para solicitar a quantidade de capacidade necessária para sua inscrição.
Observação
O comando az containerapp env workload-profile set
não está mais disponível para selecionar um perfil de carga de trabalho. Em vez disso, use az containerapp env workload-profile add ou az containerapp env workload-profile update.
Além de diferentes tamanhos de núcleo e memória, os perfis de carga de trabalho também têm limites de tamanho de imagem variados disponíveis. Para saber mais sobre os limites de tamanho de imagem para seus aplicativos de contêiner, consulte referência de hardware.
A disponibilidade de diferentes perfis de carga de trabalho varia de acordo com a região.
Consumo de recursos
Você pode restringir o uso de memória e CPU de cada aplicativo dentro de um perfil de carga de trabalho e pode executar vários aplicativos dentro de uma única instância de um perfil de carga de trabalho. No entanto, o total de recursos disponíveis para um aplicativo de contêiner é menor do que os recursos alocados para um perfil. A diferença entre os recursos alocados e disponíveis é a quantidade reservada pelo tempo de execução dos Aplicativos de Contêiner.
Scaling
Quando a demanda por novos aplicativos ou mais réplicas de um aplicativo existente excede os recursos atuais do perfil, instâncias de perfil podem ser adicionadas.
Ao mesmo tempo, se o número de réplicas necessárias diminuir, as instâncias de perfil poderão ser removidas. Você tem controle sobre as restrições no número mínimo e máximo de instâncias de perfil.
O Azure calcula a cobrança em grande parte com base no número de instâncias de perfil em execução.
Rede
Quando você usa o ambiente de perfil de carga de trabalho, recursos de rede extras que protegem totalmente o tráfego de rede de entrada e saída (como rotas definidas pelo usuário) estão disponíveis. Para saber mais sobre quais recursos de rede são suportados, consulte Rede no ambiente de Aplicativos de Contêiner do Azure. Para obter etapas sobre como proteger sua rede com Aplicativos de Contêiner, consulte a seção bloquear seu ambiente de Aplicativo de Contêiner.