Compartir a través de


Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Encabezados de tabla

Métrica: el nombre para mostrar de la métrica tal como aparece en Azure Portal.
Nombre de la API rest: nombre de métrica como se conoce en la API REST.
Unidad: unidad de medida.
Agregación: el tipo de agregación predeterminado. Valores válidos: promedio, mínimo, máximo, total, recuento.
Dimensiones - : dimensiones disponibles para la métrica.
Intervalos de agregación - : intervalos en los que se obtiene una muestra de la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico.

Para obtener información sobre cómo exportar métricas, consulte : Exportación de métricas mediante reglas de recopilación de datos y Creación de una configuración de diagnóstico en Azure Monitor.

Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.

Categoría: Recurso

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Intervalos de agregación Exportación de DS
Porcentaje de uso de memoria de CPU

Porcentaje de uso de memoria en una instancia. El uso se notifica en intervalos de un minuto.
CpuMemoryUtilizationPercentage Porcentaje Mínimo, Máximo, Promedio instanceId PT1M
Porcentaje de uso de la CPU

Porcentaje de uso de CPU en una instancia. El uso se notifica en intervalos de un minuto.
CpuUtilizationPercentage Porcentaje Mínimo, Máximo, Promedio instanceId PT1M
Errores de recopilación de datos por minuto

Número de eventos de recopilación de datos eliminados por minuto.
DataCollectionErrorsPerMinute Count Mínimo, Máximo, Promedio instanceId, , reason, type PT1M No
Eventos por minuto de la colección de datos

Número de eventos de recopilación de datos procesados por minuto.
DataCollectionEventsPerMinute Count Mínimo, Máximo, Promedio instanceId, type PT1M No
Capacidad de implementación

Número de instancias de la implementación.
DeploymentCapacity Count Mínimo, Máximo, Promedio instanceId, State PT1M No
Utilización de disco

Porcentaje de uso de disco en una instancia. El uso se notifica en intervalos de un minuto.
DiskUtilization Porcentaje Mínimo, Máximo, Promedio instanceId, disk PT1M
Energía de GPU en julios

Energía en intervalos en Joules en un nodo de GPU. La energía se notifica en intervalos de un minuto.
GpuEnergyJoules Count Mínimo, Máximo, Promedio instanceId PT1M No
Porcentaje de uso de memoria de GPU

Porcentaje de uso de memoria de GPU en una instancia. El uso se notifica en intervalos de un minuto.
GpuMemoryUtilizationPercentage Porcentaje Mínimo, Máximo, Promedio instanceId PT1M
Porcentaje de uso de GPU

Porcentaje de uso de GPU en una instancia. El uso se notifica en intervalos de un minuto.
GpuUtilizationPercentage Porcentaje Mínimo, Máximo, Promedio instanceId PT1M

Categoría: Tráfico

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Intervalos de agregación Exportación de DS
Latencia de las solicitudes P50

Latencia media de las solicitudes P50, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P50 Milisegundos Average <none> PT1M
Latencia de las solicitudes P90

Latencia media de las solicitudes P90, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P90 Milisegundos Average <none> PT1M
Latencia de las solicitudes P95

Latencia media de las solicitudes P95, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P95 Milisegundos Average <none> PT1M
Latencia de las solicitudes P99

Latencia media de las solicitudes P99, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P99 Milisegundos Average <none> PT1M
Solicitudes por minuto

Número de solicitudes enviadas a la implementación en línea en un minuto
RequestsPerMinute Count Average envoy_response_code PT1M No

Pasos siguientes