Compartir a través de


Supervisión de los puntos de conexión en línea

Azure Machine Learning usa la integración con Azure Monitor para realizar un seguimiento y supervisar las métricas y los registros de los puntos de conexión en línea. Puede ver métricas en gráficos, comparar métricas entre puntos de conexión e implementaciones, anclar métricas a paneles de Azure Portal, configurar alertas, tablas de registro de consultas e insertar registros en destinos admitidos. También puede usar Application Insights para analizar eventos de contenedores de usuario.

  • Métricas: en el caso de las métricas de nivel de punto de conexión, como la latencia de solicitud, las solicitudes por minuto, las nuevas conexiones por segundo y los bytes de red, puede explorar en profundidad para ver información detallada en el nivel de implementación o el nivel de estado. También puede explorar en profundidad las métricas de nivel de implementación, como el uso de CPU/GPU y el uso de memoria o disco en el nivel de instancia. En Monitor, puede realizar un seguimiento de estas métricas en gráficos y puede configurar paneles y alertas para realizar un análisis posterior.

  • Registros: puede enviar métricas a un área de trabajo de Log Analytics, donde puede usar la sintaxis de consulta de Kusto para consultar los registros. También puede enviar métricas a cuentas de Azure Storage o Azure Event Hubs para su posterior procesamiento. En el caso del tráfico, los registros de consola (contenedor) y los eventos relacionados con los puntos de conexión en línea, puede usar tablas de registro dedicadas. Las consultas de Kusto admiten funcionalidades de análisis complejas y la combinación de varias tablas.

  • Application Insights: los entornos mantenidos incluyen la integración con Application Insights. Puede activar o desactivar esta integración al crear una implementación en línea. Al activarlo, las métricas integradas y los registros se envían a Application Insights. Después, puede usar las características integradas de Application Insights para su posterior análisis. Algunos ejemplos de esas características incluyen métricas dinámicas, la búsqueda de transacciones, la vista de errores y la vista de rendimiento.

En este artículo verá cómo:

  • Elija el método adecuado para ver y realizar un seguimiento de las métricas y los registros.
  • Visualizar las métricas del punto de conexión en línea.
  • Crear un panel para las métricas.
  • Creación de una alerta de métrica.
  • Visualizar las métricas del punto de conexión en línea.
  • Uso de Application Insights para realizar un seguimiento de las métricas y los registros.

Requisitos previos

  • Un punto de conexión en línea de Azure Machine Learning
  • Al menos acceso de lector en el punto de conexión

Usar métricas

En Azure Portal, puede ver las páginas de métricas de los puntos de conexión e implementaciones en línea.

Acceso a métricas desde Estudio de Azure Machine Learning

Una manera fácil de acceder a las páginas de métricas es a través de vínculos que están disponibles en la interfaz de usuario de Estudio de Azure Machine Learning. Puede encontrar estos vínculos en la pestaña Detalles de la página de un punto de conexión. Estos vínculos conducen a la página de métricas de Azure Portal para el punto de conexión o la implementación.

Para acceder a las páginas de métricas a través de vínculos disponibles en Studio, siga estos pasos:

  1. En Estudio de Azure Machine Learning, vaya al área de trabajo.

  2. En Recursos, seleccione Puntos de conexión.

  3. Seleccione el nombre de un punto de conexión.

  4. En Atributos de punto de conexión, seleccione Ver métricas.

    Captura de pantalla de una página de punto de conexión en Studio que muestra los atributos del punto de conexión. Se resaltan los recursos, los puntos de conexión, los atributos de punto de conexión y las métricas ver.

    Se abre la página de métricas del punto de conexión en Azure Portal.

  5. En Azure Machine Learning Studio, en una página de punto de conexión, vaya a la sección de una implementación y seleccione Ver métricas.

    Captura de pantalla de una página de punto de conexión en Studio que muestra información de implementación. Las métricas Azul de implementación y Ver están resaltadas.

    Se abre la página de métricas de la implementación en Azure Portal.

Acceso a métricas desde Azure Portal

Otra manera de ver la página de métricas de un punto de conexión o implementación es ir directamente a Azure Portal:

  1. Vaya a Azure Portal.

  2. Vaya al punto de conexión en línea o al recurso de implementación.

    Los puntos de conexión e implementaciones en línea son recursos de Azure Resource Manager. Para encontrarlos, vaya a su grupo de recursos y busque los tipos de recursos de punto de conexión en línea de Machine Learning y la implementación en línea de Machine Learning.

  3. En la página de recursos, en Supervisión, seleccione Métricas.

    Captura de pantalla de Azure Portal que muestra la página Métricas de una implementación. La supervisión y las métricas están resaltadas.

Métricas disponibles

Las métricas que ve dependen del recurso que seleccione. Las métricas de los puntos de conexión en línea y las implementaciones en línea tienen un ámbito diferente.

Métricas en el ámbito del punto de conexión

Para obtener información sobre las métricas disponibles en el ámbito del punto de conexión en línea, consulte Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints.

Límite de ancho de banda

El ancho de banda se limita si se superan los límites de cuota para puntos de conexión en línea administrados. Para más información sobre los límites de los puntos de conexión en línea, consulte Puntos de conexión en línea y puntos de conexión por lotes de Azure Machine Learning en el artículo sobre cuotas y límites en Azure Machine Learning. Para determinar si las solicitudes están limitadas:

  • Supervise la métrica Bytes de red.
  • Compruebe los siguientes campos en los finalizadores de respuesta: ms-azureml-bandwidth-request-delay-ms y ms-azureml-bandwidth-response-delay-ms. Los valores de los campos son los retrasos, en milisegundos, del límite de ancho de banda.

Para obtener más información, consulte Problemas del límite de ancho de banda.

Métricas en el ámbito de implementación

Para obtener información sobre las métricas disponibles en el ámbito de implementación, consulte Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Creación de paneles y alertas

En Monitor, puede crear paneles y alertas basados en métricas.

Creación de paneles y visualización de consultas

Puede crear paneles personalizados y así visualizar métricas de múltiples fuentes en el portal de Azure, incluidas las métricas de su punto final en línea. Para más información sobre cómo crear paneles y visualizar consultas, consulte Creación y uso compartido de paneles de datos de Log Analytics y Creación de paneles de KPI personalizados mediante Application Insights.

Creación de alertas

También puede crear alertas personalizadas para recibir notificaciones sobre actualizaciones de estado importantes en el punto de conexión en línea:

  1. En Azure Portal, vaya a una página de métricas y seleccione Nueva regla de alertas.

    Captura de pantalla de Azure Portal que muestra la página Métricas de una implementación. Se resalta la nueva regla de alertas.

  2. En la ventana Seleccionar una señal, seleccione la señal para la que desea crear una alerta y, a continuación, seleccione Aplicar.

  3. En la página Crear una regla de alertas, escriba un umbral y edite cualquier otra configuración que desee ajustar. Para obtener más información sobre la configuración de las reglas de alertas, consulte Configuración de las condiciones de la regla de alertas. A continuación, seleccione Siguiente: Acciones.

    Captura de pantalla de la página Crear una regla de alertas en Azure Portal. El cuadro Umbral y las acciones siguientes están resaltados.

  4. En la ventana Seleccionar grupos de acciones, cree o seleccione un grupo de acciones para especificar lo que sucede cuando se desencadena la alerta. Para obtener más información, consulte Configuración de los detalles de la regla de alertas.

  5. Seleccione Revisar y crear para terminar de crear la alerta.

Escalado automático basado en métricas

Puede configurar implementaciones para escalar automáticamente en función de las métricas. Para activar la característica de escalado automático, puede usar la interfaz de usuario o el código.

Las opciones de código son la CLI de Azure Machine Learning y el SDK de Azure Machine Learning para Python. Cuando se usa código, se configuran las condiciones para desencadenar el escalado automático proporcionando el nombre de la API de REST de métricas.

Para más información, consulte Escalabilidad automática de puntos de conexión en línea en Azure Machine Learning.

Uso de registros

Hay tres registros que puede activar para los puntos de conexión en línea:

  • AmlOnlineEndpointTrafficLog: este registro de tráfico proporciona una manera de comprobar la información de las solicitudes al punto de conexión. Este registro es útil en los casos siguientes:

    • Una respuesta de solicitud no es 200 y desea obtener más información. La columna ResponseCodeReason del registro muestra el motivo. Para obtener descripciones de los códigos de estado y los motivos, consulte códigos de estado HTTPS en el artículo sobre la solución de problemas de puntos de conexión en línea.
    • Quiere buscar el código de respuesta y el motivo de la respuesta del modelo para una solicitud. Las columnas ModelStatusCode y ModelStatusReason proporcionan esta información.
    • Quiere saber la duración de una solicitud. Los registros proporcionan un desglose de la latencia. Ese desglose muestra la duración total, la duración de la solicitud, la duración de la respuesta y el retraso causado por la limitación de red.
    • Quiere comprobar el número de solicitudes recientes que se realizan correctamente y producen un error. Los registros proporcionan esta información.
  • AmlOnlineEndpointConsoleLog: este registro contiene instrucciones que los contenedores escriben como salida en la consola. Este registro es útil en los casos siguientes:

    • No se puede iniciar un contenedor. El registro de consola puede ser útil para la depuración.
    • Quiere supervisar el comportamiento del contenedor y asegurarse de que todas las solicitudes se controlan correctamente.
    • Quiere realizar un seguimiento de una solicitud desde el punto de entrada de red de un punto de conexión en línea al contenedor. Puede usar una consulta de Log Analytics que une el identificador de solicitud con información de los registros AmlOnlineEndpointConsoleLog y AmlOnlineEndpointTrafficLog.
    • Quiere ejecutar un análisis de rendimiento, por ejemplo, para determinar el tiempo que tarda el modelo en procesar cada solicitud.
  • AmlOnlineEndpointEventLog: este registro contiene información de eventos sobre el ciclo de vida del contenedor. Actualmente, el registro proporciona información sobre los siguientes tipos de eventos:

    Nombre Message
    Retroceso Retroceso del reinicio del contenedor con errores
    "Pull" aplicado Imagen de contenedor "<IMAGE_NAME>" ya presente en la máquina
    Terminando El contenedor del servidor de inferencia no pudo terminar el sondeo de ejecución y se reiniciará
    Creado Se ha creado un contenedor imagen-capturador
    Creado Se ha creado un contenedor inferencia-servidor
    Creado Se ha creado un contenedor modelo-montaje
    LivenessProbeFailed Error de sondeo de ejecución: <FAILURE_CONTENT>
    ReadinessProbeFailed Error de sondeo de preparación: <FAILURE_CONTENT>
    Iniciado Se ha iniciado un contenedor imagen-capturador
    Iniciado Se ha iniciado un contenedor inferencia-servidor
    Iniciado Se ha iniciado un contenedor modelo-montaje
    Terminando Detención del contenedor inferencia-servidor
    Terminando Detención del contenedor modelo-montaje

Activación de los registros

Importante

El registro usa la característica Log Analytics de Monitor. Si actualmente no tiene un área de trabajo de Log Analytics, puede crear una siguiendo los pasos descritos en Creación de un área de trabajo.

  1. En Azure Portal, vaya al grupo de recursos que contiene el punto de conexión y seleccione el punto de conexión.

  2. En Supervisión, seleccione Configuración de diagnóstico y, luego, seleccione Agregar configuración de diagnóstico.

  3. En la ventana Configuración de diagnóstico, escriba la siguiente información:

    • Junto a Nombre de configuración de diagnóstico, escriba un nombre para la configuración.
    • En Registros, seleccione las categorías de registro que desea activar.
    • En Detalles de destino, seleccione Enviar al área de trabajo de Log Analytics y, a continuación, seleccione la suscripción y el área de trabajo de Log Analytics que se va a usar.

    Captura de pantalla de la ventana Configuración de diagnóstico. Se seleccionan todos los registros y Enviar al área de trabajo de Log Analytics. Hay una suscripción y un área de trabajo visibles.

  4. Seleccione Guardar.

    Importante

    La conexión al área de trabajo de Log Analytics puede tardar hasta una hora en estar disponible. Espere una hora antes de continuar con los pasos de la sección siguiente.

Registros de consultas

  1. Envíe solicitudes de puntuación al punto de conexión para crear entradas en los registros.

  2. Vaya a Azure Portal. Para abrir los registros, use una de las siguientes opciones:

    • Vaya a la página de propiedades del punto de conexión en línea. En Supervisión, seleccione Registros.
    • Vaya al área de trabajo de Log Analytics. A la izquierda, seleccione Registros.
  3. Cierre la ventana Centro de consultas que se abre de forma predeterminada.

  4. En Otros, haga doble clic en AmlOnlineEndpointConsoleLog. Si no ve AmlOnlineEndpointConsoleLog, escriba ese valor en el campo de búsqueda.

    Captura de pantalla de la página Registros de Azure Portal para un punto de conexión. AmlOnlineEndpointConsoleLog está resaltado en el cuadro de búsqueda y los resultados.

  5. Selecciona Ejecutar.

    Captura de pantalla de la página Registros de Azure Portal para un punto de conexión. La ejecución está resaltada y los resultados de la consulta AmlOnlineEndpointConsoleLog están visibles.

Consultas de ejemplo

Las consultas de ejemplo están disponibles para su uso. Para ver las consultas, siga estos pasos:

  1. En la página Registros, seleccione Consultas.

  2. En el cuadro de búsqueda, escriba Punto de conexión en línea.

    Captura de pantalla de la pestaña Consultas de la página Registros de Azure Portal. Hay dos consultas de ejemplo visibles y la pestaña Consultas y el cuadro de búsqueda están resaltados.

Detalles de la columna de registro

En las tablas siguientes se proporciona información detallada sobre los datos almacenados en cada registro:

AmlOnlineEndpointTrafficLog

Propiedad Descripción
Método Método que solicita el cliente.
Ruta de acceso Ruta de acceso que solicita el cliente.
SubscriptionId El identificador de suscripción de aprendizaje automático del punto de conexión en línea.
AzureMLWorkspaceId El identificador del área de trabajo de aprendizaje automático del punto de conexión en línea.
AzureMLWorkspaceName El nombre del área de trabajo de aprendizaje automático del punto de conexión en línea.
EndpointName El nombre del punto de conexión en línea.
DeploymentName El nombre de la implementación en línea.
Protocolo El protocolo de la solicitud.
ResponseCode Código de respuesta final que se devuelve al cliente.
ResponseCodeReason Motivo del código de respuesta final que se devuelve al cliente.
ModelStatusCode Código de estado de respuesta del modelo.
ModelStatusReason Motivo del estado de respuesta del modelo.
RequestPayloadSize Los bytes totales recibidos del cliente.
ResponsePayloadSize Los bytes totales enviados de vuelta al cliente.
UserAgent El encabezado usuario-agente de la solicitud, incluidos los comentarios, pero truncados a un máximo de 70 caracteres.
XRequestId Identificador de solicitud que Azure Machine Learning genera para el seguimiento interno.
XMSClientRequestId Identificador de seguimiento que genera el cliente.
TotalDurationMs La duración en milisegundos desde la hora de inicio de la solicitud hasta la hora en que se devuelve el último byte de respuesta al cliente. Si el cliente se desconecta, la duración se toma de la hora de inicio a la hora de desconexión del cliente.
RequestDurationMs La duración en milisegundos desde la hora de inicio de la solicitud hasta la hora en que se recibe el último byte de la solicitud del cliente.
ResponseDurationMs La duración en milisegundos desde la hora de inicio de la solicitud hasta la hora en que se lee el primer byte de respuesta del modelo.
RequestThrottlingDelayMs Retraso en milisegundos en la transferencia de datos de solicitud debido a la limitación de red.
ResponseThrottlingDelayMs Retraso en milisegundos en la transferencia de datos de respuesta debido a la limitación de red.

AmlOnlineEndpointConsoleLog

Propiedad Descripción
TimeGenerated Marca de tiempo UTC de la hora en la que se genera el registro
OperationName La operación asociada al registro de registro
InstanceId El identificador de la instancia que genera el registro de registro
DeploymentName El nombre de la implementación asociada al registro
ContainerName El nombre del contenedor donde se generó el registro
Mensaje El contenido del registro

AmlOnlineEndpointEventLog

Propiedad Descripción
TimeGenerated Marca de tiempo UTC de la hora en la que se genera el registro
OperationName La operación asociada al registro de registro
InstanceId El identificador de la instancia que genera el registro de registro
DeploymentName El nombre de la implementación asociada al registro
Nombre El nombre del evento
Mensaje El contenido del evento

Uso de Application Insights

Los entornos mantenidos incluyen la integración con Application Insights. A través de esta integración, las métricas integradas y los registros se envían a Application Insights. Como resultado, puede usar características integradas de Application Insights para un análisis posterior. Algunos ejemplos de esas características incluyen métricas dinámicas, la búsqueda de transacciones, la vista de errores y la vista de rendimiento.

Para más información, consulte Introducción sobre Application Insights.

Puede activar la integración con Application Insights al crear una implementación en línea en Studio. En la página Implementación, en Diagnósticos de Application Insights, seleccione Habilitado.

Captura de pantalla de la página Implementación de Studio cuando un usuario crea un punto de conexión en línea. La configuración de diagnóstico de Application Insights está resaltada.

Al activar Application Insights, puede ver gráficos de supervisión de actividad de alto nivel para un punto de conexión en línea administrado. En Studio, vaya a la página del punto de conexión y seleccione la pestaña Supervisión.

Captura de pantalla de la pestaña Supervisión en una página de punto de conexión de Studio. La pestaña Supervisión está resaltada. Un gráfico muestra las solicitudes por minuto al punto de conexión.