Métricas com suporte para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Títulos de tabela
Métrica: o nome de exibição da métrica como aparece no portal do Azure.
Nome na API Rest - Nome da métrica conforme referido na API REST.
Unidade: unidade de medida
Agregação: o tipo de agregação padrão. Valores válidos: Médio, Mínimo, Máximo, Total, Contagem.
Dimensões: as Dimensões disponíveis para a métrica.
Intervalos de agregação: os Intervalos em que a métrica é amostrada. Por exemplo, PT1M
indica que a métrica é amostrada a cada minuto, PT30M
a cada 30 minutos, PT1H
a cada hora e assim por diante.
Exportação de DS: se a métrica é exportável para os Logs do Azure Monitor por meio das Configurações de Diagnóstico.
Para obter informações sobre como exportar métricas, consulte - Exportação de métricas usando regras de coleta de dados e Criar configurações de diagnóstico no Azure Monitor.
Para obter informações sobre retenção de métricas, consulte Visão geral das métricas do Azure Monitor.
Categoria: Recurso
Metric | Nome na API REST | Unidade | Agregação | Dimensões | Granularidade de tempo | Exportação de DS |
---|---|---|---|---|---|---|
Percentual de utilização de memória da CPU Percentual de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuMemoryUtilizationPercentage |
Percentual | Mínimo, Máximo, Média | instanceId |
PT1M | Sim |
Porcentagem de utilização de CPU Percentual de utilização de CPU em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuUtilizationPercentage |
Percentual | Mínimo, Máximo, Média | instanceId |
PT1M | Sim |
Erros de coleta de dados por minuto O número de eventos de coleta de dados removidos por minuto. |
DataCollectionErrorsPerMinute |
Count | Mínimo, Máximo, Média | instanceId , reason , type |
PT1M | Não |
Eventos de coleta de dados por minuto O número de eventos de coleta de dados processados por minuto. |
DataCollectionEventsPerMinute |
Count | Mínimo, Máximo, Média | instanceId , type |
PT1M | Não |
Capacidade de implantação O número de instâncias na implantação. |
DeploymentCapacity |
Count | Mínimo, Máximo, Média | instanceId , State |
PT1M | Não |
Utilização do disco Percentual de utilização de disco em uma instância. A utilização é relatada em intervalos de um minuto. |
DiskUtilization |
Percentual | Mínimo, Máximo, Média | instanceId , disk |
PT1M | Sim |
Energia da GPU em Joules Energia de intervalo em joules em um nó de GPU. A energia é relatada em intervalos de um minuto. |
GpuEnergyJoules |
Count | Mínimo, Máximo, Média | instanceId |
PT1M | Não |
Percentual de utilização de memória da GPU Percentual de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuMemoryUtilizationPercentage |
Percentual | Mínimo, Máximo, Média | instanceId |
PT1M | Sim |
Percentual de utilização da GPU Percentual de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuUtilizationPercentage |
Percentual | Mínimo, Máximo, Média | instanceId |
PT1M | Sim |
Categoria: Tráfego
Metric | Nome na API REST | Unidade | Agregação | Dimensões | Granularidade de tempo | Exportação de DS |
---|---|---|---|---|---|---|
Latência da solicitação P50 A latência média de solicitação P50 agregada por todos os valores de latência de solicitação coletados durante o período selecionado |
RequestLatency_P50 |
Milissegundos | Média | <none> | PT1M | Sim |
Latência de solicitação P90 A latência média de solicitação P90 agregada por todos os valores de latência de solicitação coletados durante o período selecionado |
RequestLatency_P90 |
Milissegundos | Média | <none> | PT1M | Sim |
Latência de solicitação P95 A latência média de solicitação P95 agregada por todos os valores de latência de solicitação coletados durante o período selecionado |
RequestLatency_P95 |
Milissegundos | Média | <none> | PT1M | Sim |
Latência de solicitação P99 A latência média de solicitação P99 agregada por todos os valores de latência de solicitação coletados durante o período selecionado |
RequestLatency_P99 |
Milissegundos | Média | <none> | PT1M | Sim |
Solicitações por minuto O número de solicitações enviadas à implantação online em um minuto |
RequestsPerMinute |
Contagem | Média | envoy_response_code |
PT1M | Não |