Compartilhar via


Métricas com suporte para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Títulos de tabela

Métrica: o nome de exibição da métrica como aparece no portal do Azure.
Nome na API Rest - Nome da métrica conforme referido na API REST.
Unidade: unidade de medida
Agregação: o tipo de agregação padrão. Valores válidos: Médio, Mínimo, Máximo, Total, Contagem.
Dimensões: as Dimensões disponíveis para a métrica.
Intervalos de agregação: os Intervalos em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
Exportação de DS: se a métrica é exportável para os Logs do Azure Monitor por meio das Configurações de Diagnóstico.

Para obter informações sobre como exportar métricas, consulte - Exportação de métricas usando regras de coleta de dados e Criar configurações de diagnóstico no Azure Monitor.

Para obter informações sobre retenção de métricas, consulte Visão geral das métricas do Azure Monitor.

Categoria: Recurso

Metric Nome na API REST Unidade Agregação Dimensões Granularidade de tempo Exportação de DS
Percentual de utilização de memória da CPU

Percentual de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto.
CpuMemoryUtilizationPercentage Percentual Mínimo, Máximo, Média instanceId PT1M Sim
Porcentagem de utilização de CPU

Percentual de utilização de CPU em uma instância. A utilização é relatada em intervalos de um minuto.
CpuUtilizationPercentage Percentual Mínimo, Máximo, Média instanceId PT1M Sim
Erros de coleta de dados por minuto

O número de eventos de coleta de dados removidos por minuto.
DataCollectionErrorsPerMinute Count Mínimo, Máximo, Média instanceId, reason, type PT1M Não
Eventos de coleta de dados por minuto

O número de eventos de coleta de dados processados por minuto.
DataCollectionEventsPerMinute Count Mínimo, Máximo, Média instanceId, type PT1M Não
Capacidade de implantação

O número de instâncias na implantação.
DeploymentCapacity Count Mínimo, Máximo, Média instanceId, State PT1M Não
Utilização do disco

Percentual de utilização de disco em uma instância. A utilização é relatada em intervalos de um minuto.
DiskUtilization Percentual Mínimo, Máximo, Média instanceId, disk PT1M Sim
Energia da GPU em Joules

Energia de intervalo em joules em um nó de GPU. A energia é relatada em intervalos de um minuto.
GpuEnergyJoules Count Mínimo, Máximo, Média instanceId PT1M Não
Percentual de utilização de memória da GPU

Percentual de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto.
GpuMemoryUtilizationPercentage Percentual Mínimo, Máximo, Média instanceId PT1M Sim
Percentual de utilização da GPU

Percentual de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto.
GpuUtilizationPercentage Percentual Mínimo, Máximo, Média instanceId PT1M Sim

Categoria: Tráfego

Metric Nome na API REST Unidade Agregação Dimensões Granularidade de tempo Exportação de DS
Latência da solicitação P50

A latência média de solicitação P50 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P50 Milissegundos Média <none> PT1M Sim
Latência de solicitação P90

A latência média de solicitação P90 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P90 Milissegundos Média <none> PT1M Sim
Latência de solicitação P95

A latência média de solicitação P95 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P95 Milissegundos Média <none> PT1M Sim
Latência de solicitação P99

A latência média de solicitação P99 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P99 Milissegundos Média <none> PT1M Sim
Solicitações por minuto

O número de solicitações enviadas à implantação online em um minuto
RequestsPerMinute Contagem Média envoy_response_code PT1M Não

Próximas etapas