Desempenho e escalabilidade
Importante
A partir de 20 de setembro de 2023, não será mais possível criar novos recursos do Personalizador. O serviço Personalizador será desativado no dia 1º de outubro de 2026.
Os aplicativos e os sites de alto desempenho e de alto tráfego têm dois fatores principais a considerar com o Personalizador para desempenho e escalabilidade:
- Como manter a baixa latência ao fazer chamadas à API de Classificação
- Como garantir que a taxa de transferência de treinamento acompanhe eventos de entrada
A personalização pode retornar uma classificação muito rapidamente. A maior parte da duração da chamada é dedicada à comunicação por meio da API REST. O Azure fará o dimensionamento automático da capacidade de responder rapidamente às solicitações.
Cenários de baixa latência
Alguns aplicativos exigem latências baixas ao retornar uma classificação. São necessárias latências baixas:
- Para evitar que usuário tenha que esperar um tempo considerável para exibir o conteúdo classificado.
- Para ajudar um servidor que esteja enfrentando tráfego extremo a evitar associar conexões de rede e tempo de computação escassos.
Taxa de transferência de treinamento e escalabilidade
O Personalizador funciona atualizando um modelo que é retreinado com base em mensagens enviados de forma assíncrona pelo Personalizador após as APIs de Classificação e Recompensa. Essas mensagens são enviadas usando um Hub de Eventos do Azure para o aplicativo.
É improvável que a maioria dos aplicativos atinjam a taxa de transferência máxima de treinamento e de associação do Personalizador. Embora atingir este máximo não torne o aplicativo mais lento, isso significaria que as filas no Hub de Eventos estão sendo preenchidas com mais rapidez do que elas podem ser limpas.
Como estimar seus requisitos de taxa de transferência
- Estime o número médio de bytes por evento de classificação adicionando os comprimentos dos documentos JSON de contexto e de ação.
- Divida 20 MB/seg pela média estimada de bytes.
Por exemplo, se sua carga média tem 500 recursos e cada um tem em média 20 caracteres, então cada evento tem aproximadamente 10 KB. Com essas estimativas, 20.000.000/10.000 = 2.000 eventos/s, o que representa cerca de 173 milhões de eventos/dia.
Se você está atingindo esses limites, entre em contato com nossa equipe de suporte para obter orientações sobre arquitetura.