Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Artículo
2025-01-03

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Encabezados de tabla

Métrica: el nombre para mostrar de la métrica tal como aparece en Azure Portal.
Nombre de la API rest: nombre de métrica como se conoce en la API REST.
Unidad: unidad de medida.
Agregación: el tipo de agregación predeterminado. Valores válidos: promedio, mínimo, máximo, total, recuento.
Dimensiones - : dimensiones disponibles para la métrica.
Intervalos de agregación - : intervalos en los que se obtiene una muestra de la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico.

Para obtener información sobre cómo exportar métricas, consulte : Exportación de métricas mediante reglas de recopilación de datos y Creación de una configuración de diagnóstico en Azure Monitor.

Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.

Category	Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Intervalos de agregación	Exportación de DS
Resource	Porcentaje de uso de memoria de CPU Porcentaje de uso de memoria en una instancia. El uso se notifica en intervalos de un minuto.	`CpuMemoryUtilizationPercentage`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`	PT1M	Sí
Resource	Porcentaje de uso de la CPU Porcentaje de uso de CPU en una instancia. El uso se notifica en intervalos de un minuto.	`CpuUtilizationPercentage`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`	PT1M	Sí
Resource	Errores de recopilación de datos por minuto Número de eventos de recopilación de datos eliminados por minuto.	`DataCollectionErrorsPerMinute`	Count	Mínimo, Máximo, Promedio	`instanceId`, , `reason`, `type`	PT1M	No
Resource	Eventos por minuto de la colección de datos Número de eventos de recopilación de datos procesados por minuto.	`DataCollectionEventsPerMinute`	Count	Mínimo, Máximo, Promedio	`instanceId`, `type`	PT1M	No
Resource	Capacidad de implementación Número de instancias de la implementación.	`DeploymentCapacity`	Count	Mínimo, Máximo, Promedio	`instanceId`, `State`	PT1M	No
Resource	Utilización de disco Porcentaje de uso de disco en una instancia. El uso se notifica en intervalos de un minuto.	`DiskUtilization`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`, `disk`	PT1M	Sí
Resource	Energía de GPU en julios Energía en intervalos en Joules en un nodo de GPU. La energía se notifica en intervalos de un minuto.	`GpuEnergyJoules`	Count	Mínimo, Máximo, Promedio	`instanceId`	PT1M	No
Resource	Porcentaje de uso de memoria de GPU Porcentaje de uso de memoria de GPU en una instancia. El uso se notifica en intervalos de un minuto.	`GpuMemoryUtilizationPercentage`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`	PT1M	Sí
Resource	Porcentaje de uso de GPU Porcentaje de uso de GPU en una instancia. El uso se notifica en intervalos de un minuto.	`GpuUtilizationPercentage`	Porcentaje	Mínimo, Máximo, Promedio	`instanceId`	PT1M	Sí
Tráfico	Latencia de las solicitudes P50 Latencia media de las solicitudes P50, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado	`RequestLatency_P50`	Milisegundos	Average	<none>	PT1M	Sí
Tráfico	Latencia de las solicitudes P90 Latencia media de las solicitudes P90, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado	`RequestLatency_P90`	Milisegundos	Average	<none>	PT1M	Sí
Tráfico	Latencia de las solicitudes P95 Latencia media de las solicitudes P95, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado	`RequestLatency_P95`	Milisegundos	Average	<none>	PT1M	Sí
Tráfico	Latencia de las solicitudes P99 Latencia media de las solicitudes P99, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado	`RequestLatency_P99`	Milisegundos	Average	<none>	PT1M	Sí
Tráfico	Solicitudes por minuto Número de solicitudes enviadas a la implementación en línea en un minuto	`RequestsPerMinute`	Count	Average	`envoy_response_code`	PT1M	No

Compartir a través de

Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Pasos siguientes

Comentarios

Recursos adicionales