Esquema de YAML de punto de conexión en línea de la CLI (v2)
SE APLICA A: Extensión de ML de la CLI de Azure v2 (actual)
El esquema JSON de origen se puede encontrar en https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json para el punto de conexión en línea administrado, y en https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json para el punto de conexión en línea de Kubernetes. Las diferencias entre el punto de conexión en línea administrado y el punto de conexión en línea de Kubernetes se describen en la tabla de propiedades de este artículo. El ejemplo de este artículo se centra en el punto de conexión en línea administrado.
Nota:
La sintaxis de YAML que se detalla en este documento se basa en el esquema JSON de la versión más reciente de la extensión ML de la CLI v2. Se garantiza que esta sintaxis solo funciona con la versión más reciente de la extensión ML de la CLI v2. Puede encontrar los esquemas de las versiones de extensión anteriores en https://azuremlschemasprod.azureedge.net/.
Nota:
Como referencia, hay disponible un archivo YAML de ejemplo completamente especificado para los puntos de conexión en línea administrados.
Sintaxis de YAML
Clave | Tipo | Descripción | Valores permitidos | Valor predeterminado |
---|---|---|---|---|
$schema |
string | Esquema de YAML. Si usa la extensión VS Code de Azure Machine Learning para crear el archivo YAML, la inclusión de $schema en la parte superior del archivo le permite invocar las finalizaciones del esquema y los recursos. |
||
name |
string | Necesario. Nombre del punto de conexión. Es preciso que sea único en el nivel de región de Azure. Las reglas de nomenclatura se definen en los límites de punto de conexión. |
||
description |
cadena | Descripción del punto de conexión. | ||
tags |
object | Diccionario de etiquetas del punto de conexión. | ||
auth_mode |
string | Método de autenticación para invocar el punto de conexión (operación del plano de datos). Use key para la autenticación basada en claves. Use aml_token para la autenticación basada en tokens de Azure Machine Learning. Use aad_token para la autenticación basada en tokens de Microsoft Entra. |
key , aml_token , aad_token |
key |
compute |
string | Nombre del destino de proceso en el que se ejecutarán las implementaciones de punto de conexión. Este campo solo es aplicable a las implementaciones de puntos de conexión en clústeres de Kubernetes habilitados por Azure Arc (el destino de proceso especificado en este campo debe tener type: kubernetes ). No especifique este campo si está realizando la inferencia en línea administrada. |
||
identity |
object | La configuración de identidad administrada a fin de acceder a recursos de Azure para el aprovisionamiento y la inferencia de puntos de conexión. | ||
identity.type |
string | El tipo de identidad administrada. Si el tipo es user_assigned , también se debe especificar la propiedad identity.user_assigned_identities . |
system_assigned , user_assigned |
|
identity.user_assigned_identities |
array | Lista de id. de recursos completos de las identidades asignadas por el usuario. | ||
traffic |
object | El tráfico representa el porcentaje de solicitudes que deben ser atendidas por implementaciones diferentes. Se representa mediante un diccionario de pares clave-valor, donde las claves representan el nombre de implementación y los valores representan el porcentaje de tráfico a esa implementación. Por ejemplo, blue: 90 green: 10 significa que el 90 % de las solicitudes se envían a la implementación denominada blue y el 10 % se envía a la implementación green . El tráfico total debe ser 0 o sumar hasta 100. Consulte Lanzamiento seguro de puntos de conexión en línea para ver la configuración del tráfico en acción. Nota: No puede establecer este campo durante la creación del punto de conexión en línea, ya que las implementaciones de ese punto de conexión deben crearse antes de que se pueda establecer el tráfico. Puede actualizar el tráfico de un punto de conexión en línea una vez creadas las implementaciones mediante az ml online-endpoint update ; por ejemplo, az ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10" . |
||
public_network_access |
string | Esta marca controla la visibilidad del punto de conexión administrado. Cuando es disabled , las solicitudes de puntuación entrantes se reciben mediante el punto de conexión privado del área de trabajo de Azure Machine Learning y el punto de conexión no se puede alcanzar desde redes públicas. Esta marca solo se aplica a los puntos de conexión administrados. |
enabled , disabled |
enabled |
mirror_traffic |
string | Porcentaje de tráfico activo que se va a reflejar en una implementación. La creación de reflejo del tráfico no cambia los resultados devueltos a los clientes. El porcentaje reflejado del tráfico se copia y se envía a la implementación especificada para que pueda recopilar métricas y registros sin que los clientes resulten afectados. Por ejemplo, para comprobar si la latencia está dentro de límites aceptables y que no hay errores HTTP. Se representa mediante un diccionario con un único par clave-valor, donde la clave representa el nombre de implementación y el valor representa el porcentaje de tráfico que se va a reflejar en la implementación. Para más información, consulte Prueba de una implementación con tráfico reflejado. |
Observaciones
Los comandos az ml online-endpoint
se pueden usar para administrar los puntos de conexión en línea de Azure Machine Learning.
Ejemplos
Hay ejemplos disponibles en el repositorio de GitHub de ejemplos. A continuación se muestran varios.
YAML: básico
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key
YAML: identidad asignada por el sistema
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key
YAML: identidad asignada por el usuario
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
type: user_assigned
user_assigned_identities:
- resource_id: user_identity_ARM_id_place_holder