Compartilhar via


Métricas com suporte para Microsoft.MachineLearningServices/workspaces/onlineEndpoints

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints.

Títulos de tabela

Métrica: o nome de exibição da métrica como aparece no portal do Azure.
Nome na API Rest - Nome da métrica conforme referido na API REST.
Unidade: unidade de medida
Agregação: o tipo de agregação padrão. Valores válidos: Médio, Mínimo, Máximo, Total, Contagem.
Dimensões: as Dimensões disponíveis para a métrica.
Intervalos de agregação: os Intervalos em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
Exportação de DS: se a métrica é exportável para os Logs do Azure Monitor por meio das Configurações de Diagnóstico.

Para obter informações sobre como exportar métricas, consulte - Exportação de métricas usando regras de coleta de dados e Criar configurações de diagnóstico no Azure Monitor.

Para obter informações sobre retenção de métricas, consulte Visão geral das métricas do Azure Monitor.

Para obter uma lista de logs com suporte, consulte Categorias de log com suporte – Microsoft.MachineLearningServices/workspaces/onlineEndpoints

Categoria: Tráfego

Metric Nome na API REST Unidade Agregação Dimensões Granularidade de tempo Exportação de DS
Conexões ativas

O número total de conexões TCP simultâneas ativas de clientes.
ConnectionsActive Contagem Média <none> PT1M Não
Erros de coleta de dados por minuto

O número de eventos de coleta de dados removidos por minuto.
DataCollectionErrorsPerMinute Count Mínimo, Máximo, Média deployment, reason, type PT1M Não
Eventos de coleta de dados por minuto

O número de eventos de coleta de dados processados por minuto.
DataCollectionEventsPerMinute Count Mínimo, Máximo, Média deployment, type PT1M Não
Bytes de rede

Os bytes por segundo servidos para o ponto de extremidade.
NetworkBytes BytesPerSecond Média <none> PT1M Não
Novas conexões por segundo

O número médio de novas conexões TCP por segundo estabelecidas de clientes.
NewConnectionsPerSecond CountPerSecond Média <none> PT1M Não
Latência da solicitação

O intervalo completo médio de tempo gasto para que uma solicitação seja respondida em milissegundos
RequestLatency Milissegundos Média deployment PT1M Sim
Latência da solicitação P50

A latência média de solicitação P50 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P50 Milissegundos Média deployment PT1M Sim
Latência de solicitação P90

A latência média de solicitação P90 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P90 Milissegundos Média deployment PT1M Sim
Latência de solicitação P95

A latência média de solicitação P95 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P95 Milissegundos Média deployment PT1M Sim
Latência de solicitação P99

A latência média de solicitação P99 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P99 Milissegundos Média deployment PT1M Sim
Solicitações por minuto

O número de solicitações enviadas ao ponto de extremidade online em um minuto
RequestsPerMinute Contagem Média deployment, statusCode, statusCodeClass, modelStatusCode PT1M Não

Próximas etapas