Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints
En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints.
Encabezados de tabla
Métrica: el nombre para mostrar de la métrica tal como aparece en Azure Portal.
Nombre de la API rest: nombre de métrica como se conoce en la API REST.
Unidad: unidad de medida.
Agregación: el tipo de agregación predeterminado. Valores válidos: promedio, mínimo, máximo, total, recuento.
Dimensiones - : dimensiones disponibles para la métrica.
Intervalos de agregación - : intervalos en los que se obtiene una muestra de la métrica. Por ejemplo, PT1M
indica que la métrica se muestrea cada minuto, PT30M
cada 30 minutos, PT1H
cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico.
Para obtener información sobre cómo exportar métricas, consulte : Exportación de métricas mediante reglas de recopilación de datos y Creación de una configuración de diagnóstico en Azure Monitor.
Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.
Para obtener una lista de los registros admitidos, consulte Categorías de registro admitidas: Microsoft.MachineLearningServices/workspaces/onlineEndpoints
Categoría: Tráfico
Métrica | Nombre en la API de REST | Unidad | Agregación | Dimensiones | Intervalos de agregación | Exportación de DS |
---|---|---|---|---|---|---|
Conexiones activas El número total de conexiones TCP simultáneas activas de los clientes. |
ConnectionsActive |
Count | Average | <none> | PT1M | No |
Errores de recopilación de datos por minuto Número de eventos de recopilación de datos eliminados por minuto. |
DataCollectionErrorsPerMinute |
Count | Mínimo, Máximo, Promedio | deployment , , reason , type |
PT1M | No |
Eventos por minuto de la colección de datos Número de eventos de recopilación de datos procesados por minuto. |
DataCollectionEventsPerMinute |
Count | Mínimo, Máximo, Promedio | deployment , type |
PT1M | No |
Bytes de red Bytes por segundo enviados al punto de conexión. |
NetworkBytes |
BytesPerSecond | Media | <none> | PT1M | No |
Nuevas conexiones por segundo Número promedio de nuevas conexiones TCP por segundo establecidas a partir de clientes. |
NewConnectionsPerSecond |
CountPerSecond | Average | <none> | PT1M | No |
Latencia de las solicitudes Intervalo de tiempo total que se tarda de media en responder una solicitud (en milisegundos) |
RequestLatency |
Milisegundos | Average | deployment |
PT1M | Sí |
Latencia de las solicitudes P50 Latencia media de las solicitudes P50, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P50 |
Milisegundos | Average | deployment |
PT1M | Sí |
Latencia de las solicitudes P90 Latencia media de las solicitudes P90, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P90 |
Milisegundos | Average | deployment |
PT1M | Sí |
Latencia de las solicitudes P95 Latencia media de las solicitudes P95, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P95 |
Milisegundos | Average | deployment |
PT1M | Sí |
Latencia de las solicitudes P99 Latencia media de las solicitudes P99, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P99 |
Milisegundos | Average | deployment |
PT1M | Sí |
Solicitudes por minuto Número de solicitudes enviadas al punto de conexión en línea en un minuto |
RequestsPerMinute |
Count | Average | deployment , statusCode , , statusCodeClass , modelStatusCode |
PT1M | No |