Delen via


CLI (v2) online eindpunt YAML-schema

VAN TOEPASSING OP: Azure CLI ml-extensie v2 (huidige)

Het JSON-bronschema vindt u voor https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json het beheerde online-eindpunt en voor https://azuremlschemas.azureedge.net/latest/kubernetesOnlineEndpoint.schema.json het online-eindpunt van Kubernetes. De verschillen tussen het beheerde online-eindpunt en het online-eindpunt van Kubernetes worden beschreven in de tabel met eigenschappen in dit artikel. Voorbeeld in dit artikel is gericht op het beheerde online-eindpunt.

Notitie

De YAML-syntaxis die in dit document wordt beschreven, is gebaseerd op het JSON-schema voor de nieuwste versie van de ML CLI v2-extensie. Deze syntaxis werkt gegarandeerd alleen met de nieuwste versie van de ML CLI v2-extensie. U vindt de schema's voor oudere extensieversies op https://azuremlschemasprod.azureedge.net/.

Notitie

Een volledig opgegeven YAML-voorbeeld voor beheerde online-eindpunten is beschikbaar ter referentie

YAML-syntaxis

Sleutel Type Description Toegestane waarden Default value
$schema tekenreeks Het YAML-schema. Als u de Azure Machine Learning VS Code-extensie gebruikt om het YAML-bestand te ontwerpen, inclusief $schema bovenaan het bestand, kunt u schema- en resourcevoltooiingen aanroepen.
name tekenreeks Vereist. Naam van het eindpunt. Moet uniek zijn op het niveau van de Azure-regio.

Naamgevingsregels worden gedefinieerd onder eindpuntlimieten.
description tekenreeks Beschrijving van het eindpunt.
tags object Woordenlijst met tags voor het eindpunt.
auth_mode tekenreeks De verificatiemethode voor het aanroepen van het eindpunt (gegevensvlakbewerking). Gebruiken key voor verificatie op basis van sleutels. Gebruiken aml_token voor verificatie op basis van tokens op basis van Azure Machine Learning. Gebruiken aad_token voor verificatie op basis van Microsoft Entra-tokens. key, , aml_tokenaad_token key
compute tekenreeks Naam van het rekendoel waarop de eindpuntimplementaties moeten worden uitgevoerd. Dit veld is alleen van toepassing op eindpuntimplementaties voor Kubernetes-clusters met Azure Arc (het rekendoel dat in dit veld is opgegeven, moet ).type: kubernetes Geef dit veld niet op als u beheerde onlinedeductie uitvoert.
identity object De configuratie van de beheerde identiteit voor toegang tot Azure-resources voor het inrichten en deductie van eindpunten.
identity.type tekenreeks Het type beheerde identiteit. Als het type is user_assigned, moet de identity.user_assigned_identities eigenschap ook worden opgegeven. system_assigned, user_assigned
identity.user_assigned_identities matrix Lijst met volledig gekwalificeerde resource-id's van de door de gebruiker toegewezen identiteiten.
traffic object Verkeer vertegenwoordigt het percentage aanvragen dat moet worden verwerkt door verschillende implementaties. Het wordt vertegenwoordigd door een woordenlijst van sleutel-waardeparen, waarbij sleutels de implementatienaam en -waarde vertegenwoordigen het percentage verkeer naar die implementatie. Betekent bijvoorbeeld blue: 90 green: 10 dat 90% aanvragen worden verzonden naar de implementatie met de naam blue en 10% wordt verzonden naar de implementatie green. Het totale verkeer moet 0 zijn of maximaal 100 bedragen. Zie Veilige implementatie voor online-eindpunten om de verkeersconfiguratie in actie te zien.

Opmerking: u kunt dit veld niet instellen tijdens het maken van online-eindpunten, omdat de implementaties onder dat eindpunt moeten worden gemaakt voordat verkeer kan worden ingesteld. U kunt het verkeer voor een online-eindpunt bijwerken nadat de implementaties zijn gemaakt met bijvoorbeeld az ml online-endpoint updateaz ml online-endpoint update --name <endpoint_name> --traffic "blue=90 green=10".
public_network_access tekenreeks Deze vlag bepaalt de zichtbaarheid van het beheerde eindpunt. Wanneer disabledbinnenkomende scoreaanvragen worden ontvangen met behulp van het privé-eindpunt van de Azure Machine Learning-werkruimte en het eindpunt niet kan worden bereikt vanuit openbare netwerken. Deze vlag is alleen van toepassing op beheerde eindpunten enabled, disabled enabled
mirror_traffic tekenreeks Percentage liveverkeer dat moet worden gespiegeld aan een implementatie. Het spiegelen van verkeer wijzigt de resultaten die worden geretourneerd naar clients niet. Het gespiegelde percentage verkeer wordt gekopieerd en verzonden naar de opgegeven implementatie, zodat u metrische gegevens en logboekregistratie kunt verzamelen zonder dat dit van invloed is op clients. Als u bijvoorbeeld wilt controleren of de latentie binnen acceptabele grenzen ligt en of er geen HTTP-fouten zijn. Het wordt vertegenwoordigd door een woordenlijst met één sleutel-waardepaar, waarbij de sleutel de implementatienaam vertegenwoordigt en de waarde het percentage verkeer vertegenwoordigt dat moet worden gespiegeld aan de implementatie. Zie Een implementatie testen met gespiegeld verkeer voor meer informatie.

Opmerkingen

De az ml online-endpoint opdrachten kunnen worden gebruikt voor het beheren van online-eindpunten van Azure Machine Learning.

Voorbeelden

Voorbeelden zijn beschikbaar in de GitHub-voorbeeldenopslagplaats. Hieronder ziet u een aantal.

YAML: basic

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

YAML: door het systeem toegewezen identiteit

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-sai-endpoint
auth_mode: key

YAML: door de gebruiker toegewezen identiteit

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-uai-endpoint
auth_mode: key
identity:
  type: user_assigned
  user_assigned_identities:
    - resource_id: user_identity_ARM_id_place_holder

Volgende stappen