Perfis de carga de trabalho no Azure Container Apps
Um perfil de carga de trabalho determina a quantidade de recursos de computação e memória disponíveis para os aplicativos de contêiner implantados em um ambiente.
Os perfis são configurados para atender às diferentes necessidades de seus aplicativos.
Tipo de perfil | Description | Utilização potencial |
---|---|---|
Consumo | Adicionado automaticamente a qualquer novo ambiente. | Aplicações que não requerem requisitos de hardware específicos |
Dedicado (Propósito geral) | Equilíbrio de memória e recursos de computação | Aplicações que requerem maiores quantidades de CPU e/ou memória |
Dedicado (memória otimizada) | Aumento dos recursos de memória | Aplicativos que precisam de acesso a grandes dados na memória, modelos de aprendizado de máquina na memória ou outros requisitos de alta memória |
Dedicado (GPU habilitada) (visualização) | GPU habilitada com maior memória e recursos de computação disponíveis nas regiões Oeste dos EUA 3 e Norte da Europa. | Aplicativos que exigem GPU |
Nota
Ao usar perfis de carga de trabalho habilitados para GPU, verifique se seu aplicativo está executando a versão mais recente do CUDA.
O perfil de carga de trabalho de consumo é o perfil padrão adicionado a cada tipo de ambiente de perfis de carga de trabalho. Você pode adicionar perfis de carga de trabalho dedicados ao seu ambiente ao criá-lo ou depois de criá-lo. Os ambientes de perfis de carga de trabalho são implantados separadamente dos ambientes somente de consumo.
Para cada perfil de carga de trabalho dedicada em seu ambiente, você pode:
- Selecione o tipo e o tamanho
- Implantar vários aplicativos no perfil
- Use o dimensionamento automático para adicionar e remover instâncias com base nas necessidades dos aplicativos
- Limitar o dimensionamento do perfil para controlar melhor os custos
Você pode configurar cada um dos seus aplicativos para serem executados em qualquer um dos perfis de carga de trabalho definidos em seu ambiente de Aplicativos de Contêiner. Essa configuração é ideal para implantar microsserviços em que cada aplicativo pode ser executado na infraestrutura de computação apropriada.
Nota
Você só pode aplicar um perfil de carga de trabalho GPU a um ambiente à medida que o ambiente é criado.
Tipos de perfil
Existem diferentes tipos e tamanhos de perfis de carga de trabalho disponíveis por região. Por padrão, cada plano dedicado inclui um perfil de consumo, mas você também pode adicionar qualquer um dos seguintes perfis:
Nome a apresentar | Nome | vCPU | Memória (GiB) | GPU | Categoria | Alocação |
---|---|---|---|---|---|---|
Consumo | Consumo | 4 | 8 | - | Consumo | por réplica |
Consumo-GPU-NC24-A100 (pré-visualização) | GPU de consumo | 24 | 220 | 1 | Consumo | por réplica |
Consumo-GPU-NC8as-T4 (pré-visualização) | GPU de consumo | 8 | 56 | 1 | Consumo | por réplica |
Dedicado-D4 | D4 | 4 | 16 | - | Fins gerais | por nó |
Dedicado-D8 | D 8 | 8 | 32 | - | Fins gerais | por nó |
Dedicado-D16 | D 16 | 16 | 64 | - | Fins gerais | por nó |
Dedicado-D32 | D 32 | 32 | 128 | - | Fins gerais | por nó |
Dedicado-E4 | E4 | 4 | 32 | - | Com otimização de memória | por nó |
Dedicado-E8 | E8 | 8 | 64 | - | Com otimização de memória | por nó |
Dedicado-E16 | E 16 | 16 | 128 | - | Com otimização de memória | por nó |
Dedicado-E32 | E 32 | 32 | 256 | - | Com otimização de memória | por nó |
Dedicado-NC24-A100 (pré-visualização) | NC24-A100 | 24 | 220 | 1 | GPU ativada | por nó* |
Dedicado-NC48-A100 (visualização) | NC48-A100 | 48 | 440 | 2 | GPU ativada | por nó* |
Dedicado-NC96-A100 (visualização) | NC96-A100 | 96 | 880 | 4 | GPU ativada | por nó* |
* A capacidade é atribuída caso a caso. Envie um tíquete de suporte para solicitar o valor de capacidade necessário para sua inscrição.
Nota
O comando az containerapp env workload-profile set
não está mais disponível para selecionar um perfil de carga de trabalho. Em vez disso, use az containerapp env workload-profile add ou az containerapp env workload-profile update.
Além de diferentes tamanhos de núcleo e memória, os perfis de carga de trabalho também têm limites de tamanho de imagem variáveis disponíveis. Para saber mais sobre os limites de tamanho de imagem para seus aplicativos de contêiner, consulte Referência de hardware.
A disponibilidade de diferentes perfis de carga de trabalho varia de acordo com a região.
Consumo de recursos
Você pode restringir a memória e o uso da CPU de cada aplicativo dentro de um perfil de carga de trabalho e pode executar vários aplicativos dentro de uma única instância de um perfil de carga de trabalho. No entanto, o total de recursos disponíveis para um aplicativo de contêiner é menor do que os recursos alocados para um perfil. A diferença entre recursos alocados e disponíveis é a quantidade reservada pelo tempo de execução dos Aplicativos de Contêiner.
Dimensionamento
Quando a demanda por novos aplicativos ou mais réplicas de um aplicativo existente excede os recursos atuais do perfil, instâncias de perfil podem ser adicionadas.
Ao mesmo tempo, se o número de réplicas necessárias diminuir, as instâncias de perfil poderão ser removidas. Você tem controle sobre as restrições no número mínimo e máximo de instâncias de perfil.
O Azure calcula a faturação em grande parte com base no número de instâncias de perfil em execução.
Rede
Quando você usa o ambiente de perfil de carga de trabalho, recursos de rede adicionais que protegem totalmente seu tráfego de rede de entrada e saída (como rotas definidas pelo usuário) estão disponíveis. Para saber mais sobre quais recursos de rede são suportados, consulte Rede no ambiente de Aplicativos de Contêiner do Azure. Para obter etapas sobre como proteger sua rede com Aplicativos de Contêiner, consulte a seção Bloquear seu ambiente de Aplicativo de Contêiner.