Partilhar via


Métricas suportadas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Cabeçalhos de tabela

Métrica - O nome para exibição da métrica conforme aparece no portal do Azure.
Nome na API REST - Nome da métrica conforme referido na API REST.
Unidade - Unidade de medida.
Agregação - O tipo de agregação padrão. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Intervalos de grãos de - tempo em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
DS Export- Se a métrica é exportável para os Logs do Azure Monitor por meio das Configurações de Diagnóstico.

Para obter informações sobre como exportar métricas, consulte - Exportação de métricas usando regras de coleta de dados e Criar configurações de diagnóstico no Azure Monitor.

Para obter informações sobre retenção de métricas, consulte Visão geral do Azure Monitor Metrics.

Categoria: Recurso

Métrica Nome na API REST Unit Agregação Dimensões Grãos de tempo DS Exportação
Percentagem de utilização da memória da CPU

Porcentagem de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto.
CpuMemoryUtilizationPercentage Percentagem Mínimo, Máximo, Médio instanceId PT1M Sim
Percentagem de utilização da CPU

Porcentagem de utilização da CPU em uma instância. A utilização é relatada em intervalos de um minuto.
CpuUtilizationPercentage Percentagem Mínimo, Máximo, Médio instanceId PT1M Sim
Erros de coleta de dados por minuto

O número de eventos de coleta de dados caiu por minuto.
DataCollectionErrorsPerMinute Count Mínimo, Máximo, Médio instanceId, reason, type PT1M Não
Eventos de coleta de dados por minuto

O número de eventos de coleta de dados processados por minuto.
DataCollectionEventsPerMinute Count Mínimo, Máximo, Médio instanceId, type PT1M Não
Capacidade de implantação

O número de instâncias na implantação.
DeploymentCapacity Count Mínimo, Máximo, Médio instanceId, State PT1M Não
Utilização do disco

Porcentagem de utilização do disco em uma instância. A utilização é relatada em intervalos de um minuto.
DiskUtilization Percentagem Mínimo, Máximo, Médio instanceId, disk PT1M Sim
Energia da GPU em Joules

Energia de intervalo em Joules em um nó de GPU. A energia é reportada em intervalos de um minuto.
GpuEnergyJoules Count Mínimo, Máximo, Médio instanceId PT1M Não
Percentagem de utilização da memória GPU

Porcentagem de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto.
GpuMemoryUtilizationPercentage Percentagem Mínimo, Máximo, Médio instanceId PT1M Sim
Percentagem de utilização da GPU

Porcentagem de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto.
GpuUtilizationPercentage Percentagem Mínimo, Máximo, Médio instanceId PT1M Sim

Categoria: Trânsito

Métrica Nome na API REST Unit Agregação Dimensões Grãos de tempo DS Exportação
Latência de solicitação P50

A latência média da solicitação P50 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado
RequestLatency_P50 Milissegundos Média <nenhum> PT1M Sim
Latência de solicitação P90

A latência média da solicitação P90 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado
RequestLatency_P90 Milissegundos Média <nenhum> PT1M Sim
Latência de solicitação P95

A latência média da solicitação P95 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado
RequestLatency_P95 Milissegundos Média <nenhum> PT1M Sim
Latência de solicitação P99

A latência média da solicitação P99 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado
RequestLatency_P99 Milissegundos Média <nenhum> PT1M Sim
Pedidos por minuto

O número de solicitações enviadas para implantação on-line dentro de um minuto
RequestsPerMinute Count Média envoy_response_code PT1M Não

Próximos passos