Compartir a través de


Esquema de YAML de punto de conexión en línea de la CLI (v2)

SE APLICA A: Extensión de ML de la CLI de Azure v2 (actual)

El esquema JSON de origen se puede encontrar en https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json para el punto de conexión en línea administrado, y en https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json para el punto de conexión en línea de Kubernetes. Las diferencias entre el punto de conexión en línea administrado y el punto de conexión en línea de Kubernetes se describen en la tabla de propiedades de este artículo. El ejemplo de este artículo se centra en el punto de conexión en línea administrado.

Nota:

La sintaxis de YAML que se detalla en este documento se basa en el esquema JSON de la versión más reciente de la extensión ML de la CLI v2. Se garantiza que esta sintaxis solo funciona con la versión más reciente de la extensión ML de la CLI v2. Puede encontrar los esquemas de las versiones de extensión anteriores en https://azuremlschemasprod.azureedge.net/.

Nota:

Como referencia, hay disponible un archivo YAML de ejemplo completamente especificado para los puntos de conexión en línea administrados.

Sintaxis de YAML

Clave Tipo Descripción Valores permitidos Valor predeterminado
$schema string Esquema de YAML. Si usa la extensión VS Code de Azure Machine Learning para crear el archivo YAML, la inclusión de $schema en la parte superior del archivo le permite invocar las finalizaciones del esquema y los recursos.
name string Necesario. Nombre del punto de conexión. Es preciso que sea único en el nivel de región de Azure.

Las reglas de nomenclatura se definen en los límites de punto de conexión.
description cadena Descripción del punto de conexión.
tags object Diccionario de etiquetas del punto de conexión.
auth_mode string Método de autenticación para invocar el punto de conexión (operación del plano de datos). Use key para la autenticación basada en claves. Use aml_token para la autenticación basada en tokens de Azure Machine Learning. Use aad_token para la autenticación basada en tokens de Microsoft Entra. key, aml_token, aad_token key
compute string Nombre del destino de proceso en el que se ejecutarán las implementaciones de punto de conexión. Este campo solo es aplicable a las implementaciones de puntos de conexión en clústeres de Kubernetes habilitados por Azure Arc (el destino de proceso especificado en este campo debe tener type: kubernetes). No especifique este campo si está realizando la inferencia en línea administrada.
identity object La configuración de identidad administrada a fin de acceder a recursos de Azure para el aprovisionamiento y la inferencia de puntos de conexión.
identity.type string El tipo de identidad administrada. Si el tipo es user_assigned, también se debe especificar la propiedad identity.user_assigned_identities. system_assigned, user_assigned
identity.user_assigned_identities array Lista de id. de recursos completos de las identidades asignadas por el usuario.
traffic object El tráfico representa el porcentaje de solicitudes que deben ser atendidas por implementaciones diferentes. Se representa mediante un diccionario de pares clave-valor, donde las claves representan el nombre de implementación y los valores representan el porcentaje de tráfico a esa implementación. Por ejemplo, blue: 90 green: 10 significa que el 90 % de las solicitudes se envían a la implementación denominada blue y el 10 % se envía a la implementación green. El tráfico total debe ser 0 o sumar hasta 100. Consulte Lanzamiento seguro de puntos de conexión en línea para ver la configuración del tráfico en acción.

Nota: No puede establecer este campo durante la creación del punto de conexión en línea, ya que las implementaciones de ese punto de conexión deben crearse antes de que se pueda establecer el tráfico. Puede actualizar el tráfico de un punto de conexión en línea una vez creadas las implementaciones mediante az ml online-endpoint update; por ejemplo, az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10".
public_network_access string Esta marca controla la visibilidad del punto de conexión administrado. Cuando es disabled, las solicitudes de puntuación entrantes se reciben mediante el punto de conexión privado del área de trabajo de Azure Machine Learning y el punto de conexión no se puede alcanzar desde redes públicas. Esta marca solo se aplica a los puntos de conexión administrados. enabled, disabled enabled
mirror_traffic string Porcentaje de tráfico activo que se va a reflejar en una implementación. La creación de reflejo del tráfico no cambia los resultados devueltos a los clientes. El porcentaje reflejado del tráfico se copia y se envía a la implementación especificada para que pueda recopilar métricas y registros sin que los clientes resulten afectados. Por ejemplo, para comprobar si la latencia está dentro de límites aceptables y que no hay errores HTTP. Se representa mediante un diccionario con un único par clave-valor, donde la clave representa el nombre de implementación y el valor representa el porcentaje de tráfico que se va a reflejar en la implementación. Para más información, consulte Prueba de una implementación con tráfico reflejado.

Observaciones

Los comandos az ml online-endpoint se pueden usar para administrar los puntos de conexión en línea de Azure Machine Learning.

Ejemplos

Hay ejemplos disponibles en el repositorio de GitHub de ejemplos. A continuación se muestran varios.

YAML: básico

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

YAML: identidad asignada por el sistema

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key

YAML: identidad asignada por el usuario

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
  type: user_assigned
  user_assigned_identities:
    - resource_id: user_identity_ARM_id_place_holder

Pasos siguientes