Métricas suportadas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Cabeçalhos de tabela
Métrica - O nome para exibição da métrica conforme aparece no portal do Azure.
Nome na API REST - Nome da métrica conforme referido na API REST.
Unidade - Unidade de medida.
Agregação - O tipo de agregação padrão. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Intervalos de grãos de - tempo em que a métrica é amostrada. Por exemplo, PT1M
indica que a métrica é amostrada a cada minuto, PT30M
a cada 30 minutos, PT1H
a cada hora e assim por diante.
DS Export- Se a métrica é exportável para os Logs do Azure Monitor por meio das Configurações de Diagnóstico.
Para obter informações sobre como exportar métricas, consulte - Exportação de métricas usando regras de coleta de dados e Criar configurações de diagnóstico no Azure Monitor.
Para obter informações sobre retenção de métricas, consulte Visão geral do Azure Monitor Metrics.
Categoria: Recurso
Métrica | Nome na API REST | Unit | Agregação | Dimensões | Grãos de tempo | DS Exportação |
---|---|---|---|---|---|---|
Percentagem de utilização da memória da CPU Porcentagem de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuMemoryUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
Percentagem de utilização da CPU Porcentagem de utilização da CPU em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
Erros de coleta de dados por minuto O número de eventos de coleta de dados caiu por minuto. |
DataCollectionErrorsPerMinute |
Count | Mínimo, Máximo, Médio | instanceId , reason , type |
PT1M | Não |
Eventos de coleta de dados por minuto O número de eventos de coleta de dados processados por minuto. |
DataCollectionEventsPerMinute |
Count | Mínimo, Máximo, Médio | instanceId , type |
PT1M | Não |
Capacidade de implantação O número de instâncias na implantação. |
DeploymentCapacity |
Count | Mínimo, Máximo, Médio | instanceId , State |
PT1M | Não |
Utilização do disco Porcentagem de utilização do disco em uma instância. A utilização é relatada em intervalos de um minuto. |
DiskUtilization |
Percentagem | Mínimo, Máximo, Médio | instanceId , disk |
PT1M | Sim |
Energia da GPU em Joules Energia de intervalo em Joules em um nó de GPU. A energia é reportada em intervalos de um minuto. |
GpuEnergyJoules |
Count | Mínimo, Máximo, Médio | instanceId |
PT1M | Não |
Percentagem de utilização da memória GPU Porcentagem de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuMemoryUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
Percentagem de utilização da GPU Porcentagem de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
Categoria: Trânsito
Métrica | Nome na API REST | Unit | Agregação | Dimensões | Grãos de tempo | DS Exportação |
---|---|---|---|---|---|---|
Latência de solicitação P50 A latência média da solicitação P50 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P50 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
Latência de solicitação P90 A latência média da solicitação P90 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P90 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
Latência de solicitação P95 A latência média da solicitação P95 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P95 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
Latência de solicitação P99 A latência média da solicitação P99 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P99 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
Pedidos por minuto O número de solicitações enviadas para implantação on-line dentro de um minuto |
RequestsPerMinute |
Count | Média | envoy_response_code |
PT1M | Não |