Distribuire modelli per l'assegnazione dei punteggi negli endpoint batch

Articolo
10/16/2024

SI APPLICA A:Estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)Python SDK azure-ai-ml v2 (corrente)

Gli endpoint batch offrono un modo pratico per distribuire modelli che eseguono l'inferenza su grandi volumi di dati. Questi endpoint batch semplificano il processo di hosting dei modelli per l’assegnazione punteggi batch, in modo da potersi concentrare sull'apprendimento automatico piuttosto che sull'infrastruttura.

Usare endpoint batch per la distribuzione di modelli quando:

Si dispone di modelli dispendiosi che richiedono più tempo per l'esecuzione dell'inferenza.
È necessario eseguire l'inferenza su grandi quantità di dati distribuiti in più file.
Non si dispone di requisiti di bassa latenza.
È possibile sfruttare la parallelizzazione.

In questo articolo si usa un endpoint batch per distribuire un modello di apprendimento automatico che risolve il classico problema di riconoscimento delle cifre MNIST (Modified National Institute of Standards and Technology). Il modello distribuito, quindi, esegue l'inferenza batch su grandi quantità di dati, in questo caso file di immagine. Si comincia creando una distribuzione batch di un modello creato usando Torch. Questa distribuzione diventa quella predefinita nell'endpoint. Successivamente, si crea una seconda distribuzione di una modalità creata con TensorFlow (Keras), si testa la seconda distribuzione, quindi si imposta come distribuzione predefinita dell'endpoint.

Per seguire gli esempi di codice e i file necessari per eseguire i comandi in questo articolo in locale, vedere la sezione Clonare il repository di esempi. Gli esempi di codice e i file sono contenuti nel repository azureml-examples.

Prerequisiti

Prima di seguire la procedura descritta in questo articolo, accertarsi di disporre dei prerequisiti seguenti:

Una sottoscrizione di Azure. Se non si ha una sottoscrizione di Azure, creare un account gratuito prima di iniziare. Provare la versione gratuita o a pagamento di Azure Machine Learning.
Un'area di lavoro di Azure Machine Learning. Se non se ne ha una, seguire la procedura descritta nell'articolo Come gestire le aree di lavoro per crearne una.
Per eseguire le attività seguenti, accertarsi di disporre di queste autorizzazioni nell’area di lavoro:
- Per creare/gestire endpoint e distribuzioni batch: usare il ruolo Proprietario, il ruolo Collaboratore o un ruolo personalizzato che consenta Microsoft.MachineLearningServices/workspaces/batchEndpoints/*.
- Per creare distribuzioni ARM nel gruppo di risorse dell'area di lavoro: usare il ruolo Proprietario, il ruolo Collaboratore o un ruolo personalizzato che consenta Microsoft.Resources/deployments/write nel gruppo di risorse in cui viene distribuita l'area di lavoro.
Per usare Azure Machine Learning, è necessario installare il software seguente:
SI APPLICA A: Estensione ml dell'interfaccia della riga di comando di Azure v2 (corrente)

L’interfaccia della riga di comando di Azure e l’estensione ml per Azure Machine Learning.
```
az extension add -n ml
```
SI APPLICA A: Python SDK azure-ai-ml v2 (corrente)

Installare l'SDK di Azure Machine Learning per Python.
```
pip install azure-ai-ml
```
Non sono previsti altri requisiti se si intende utilizzare studio di Azure Machine Learning.

Clonare il repository di esempi

L'esempio contenuto in questo articolo si basa sugli esempi di codice contenuti nel repository azureml-examples. Per eseguire i comandi in locale senza dover copiare o incollare il file YAML e altri file, innanzitutto clonare il repository quindi cambiare le directory nella cartella:

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli/endpoints/batch/deploy-models/mnist-classifier

!git clone https://github.com/Azure/azureml-examples --depth 1
!cd azureml-examples/sdk/python/endpoints/batch/deploy-models/mnist-classifier

Per seguire questo esempio in un notebook Jupyter, nel repository clonato aprire il notebook: mnist-batch.ipynb.

Preparare il sistema

Connettersi all'area di lavoro

Connettersi prima di tutto all'area di lavoro di Azure Machine Learning in cui si lavorerà.

Se le impostazioni predefinite per l'interfaccia della riga di comando di Azure non sono già state impostate, salvare le proprie impostazioni predefinite. Per evitare di passare più volte i valori per la sottoscrizione, l'area di lavoro, il gruppo di risorse e la posizione, eseguire questo codice:

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

L’ area di lavoro è la risorsa di primo livello per Azure Machine Learning, che offre una posizione centralizzata per lavorare con tutti gli artefatti creati quando si usa Azure Machine Learning. In questa sezione, ci si connetterà all'area di lavoro in cui verranno eseguite le attività di distribuzione.

Importare le librerie necessarie:

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

Nota

Le classi ModelBatchDeployment e PipelineComponentBatchDeployment sono state introdotte nella versione 1.7.0 dell'SDK.

Configurare i dettagli e ottenere un handle per l'area di lavoro:

subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

Creare l'ambiente di calcolo

Gli endpoint batch vengono eseguiti in cluster di calcolo e supportano sia cluster di calcolo di Azure Machine Learning (AmlCompute) che cluster Kubernetes. I cluster sono una risorsa condivisa, quindi un solo cluster può ospitare una o più distribuzioni batch (insieme ad altri carichi di lavoro, se lo si desidera).

Creare un ambiente di calcolo denominato batch-cluster, come mostrato nel codice seguente. Modificarlo in base alle esigenze e fare riferimento all'ambiente di calcolo usando azureml:<your-compute-name>.

az ml compute create -n batch-cluster --type amlcompute --min-instances 0 --max-instances 5

compute_name = "batch-cluster"
if not any(filter(lambda m: m.name == compute_name, ml_client.compute.list())):
    compute_cluster = AmlCompute(
        name=compute_name,
        description="CPU cluster compute",
        min_instances=0,
        max_instances=2,
    )
    ml_client.compute.begin_create_or_update(compute_cluster).result()

Nota

A questo punto, non viene addebitato alcun costo per l'ambiente di calcolo, perché il cluster rimane a 0 nodi fino a quando non viene richiamato un endpoint batch e non viene inviato un processo di assegnazione punteggi batch. Per altre informazioni sui costi di calcolo, vedere Gestire e ottimizzare i costi per AmlCompute.

Creare un endpoint batch

Un endpoint batch è un endpoint HTTPS che i client possono chiamare per attivare un processo di assegnazione punteggi batch. Un processo di assegnazione punteggi batch è un processo che assegna punteggi a più input. Una distribuzione batch è un set di risorse di calcolo che ospitano il modello che esegue l'assegnazione punteggi batch (o inferenza batch) effettiva. Un endpoint batch può avere più distribuzioni batch. Per altre informazioni sugli endpoint batch, vedere Cosa sono gli endpoint?.

Suggerimento

Una delle distribuzioni batch fungerà da distribuzione predefinita per l'endpoint. Quando viene richiamato l'endpoint, la distribuzione predefinita esegue l'assegnazione punteggi batch effettiva. Per altre informazioni su endpoint e distribuzioni, vedere endpoint batch e distribuzione batch.

Assegnare un nome all'endpoint. Il nome dell’endpoint deve essere univoco all'interno di un'area di Azure, poiché il nome è incluso nell'URI dell'endpoint. Ad esempio, può esistere solo un endpoint batch con il nome mybatchendpoint in westus2.
Inserire il nome dell'endpoint in una variabile in modo da potervi fare riferimento con facilità in un secondo momento.
```
ENDPOINT_NAME="mnist-batch"
```
Inserire il nome dell'endpoint in una variabile in modo da potervi fare riferimento con facilità in un secondo momento.
```
endpoint_name = "mnist-batch"
```
Fornire il nome dell'endpoint in un secondo momento, quando viene creata la distribuzione.

Configurare l'endpoint batch

Il file YAML seguente definisce un endpoint batch. È possibile usare questo file con il comando dell'interfaccia della riga di comando per la creazione di un endpoint batch.

endpoint.yml

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: mnist-batch
description: A batch endpoint for scoring images from the MNIST dataset.
tags:
  type: deep-learning

Nella tabella seguente sono descritte le proprietà chiave dell'endpoint. Per lo schema YAML completo dell'endpoint batch, vedere Schema YAML dell'endpoint batch dell'interfaccia della riga di comando (v2).

Chiave	Descrizione
`name`	Nome dell'endpoint batch. Deve essere univoco a livello di area di Azure.
`description`	Descrizione dell'endpoint batch. Questa proprietà è facoltativa.
`tags`	Tag da includere nell'endpoint. Questa proprietà è facoltativa.

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="A batch endpoint for scoring images from the MNIST dataset.",
    tags={"type": "deep-learning"},
)

Nella tabella seguente sono descritte le proprietà chiave dell'endpoint. Per altre informazioni sulla definizione dell'endpoint batch, vedere BatchEndpoint Class.

Chiave	Descrizione
`name`	Nome dell'endpoint batch. Deve essere univoco a livello di area di Azure.
`description`	Descrizione dell'endpoint batch. Questa proprietà è facoltativa.
`tags`	Tag da includere nell'endpoint. Questa proprietà è facoltativa.

Creare l'endpoint:
Eseguire il codice seguente per creare l'endpoint.
```
az ml batch-endpoint create --file endpoint.yml  --name $ENDPOINT_NAME
```
```
ml_client.begin_create_or_update(endpoint).result()
```
L'endpoint viene creato in un secondo momento, quando viene creata la distribuzione.

Creare una distribuzione batch

Una distribuzione modello è un set di risorse necessarie per ospitare il modello che esegue l'inferenza. Per creare una distribuzione modello batch, sono necessari gli elementi seguenti:

Un modello registrato nell'area di lavoro
Il codice per assegnare punteggi al modello
Un ambiente con le dipendenze del modello installate
Le impostazioni dell’ambiente di calcolo e delle risorse già create

Cominciare registrando il modello da distribuire, un modello Torch per il noto problema di riconoscimento delle cifre (MNIST). Le distribuzioni batch possono distribuire solo modelli registrati nell'area di lavoro. È possibile ignorare questo passaggio se il modello da distribuire è già registrato.

Suggerimento

I modelli sono associati alla distribuzione anziché all'endpoint. Ciò implica che un singolo endpoint può gestire modelli diversi o versioni di modelli diversi nello stesso endpoint, purché vengano distribuiti in distribuzioni differenti.
```
MODEL_NAME='mnist-classifier-torch'
az ml model create --name $MODEL_NAME --type "custom_model" --path "deployment-torch/model"
```
```
model_name = "mnist-classifier-torch"
model_local_path = "deployment-torch/model/"

model = ml_client.models.create_or_update(
    Model(
        name=model_name,
        path=model_local_path,
        type=AssetTypes.CUSTOM_MODEL,
        tags={"task": "classification", "framework": "torch"},
    )
)
```
1. Passare alla scheda Modelli nel menu laterale.
2. Selezionare Registra>Da file locali.
3. Nella procedura guidata lasciare l'opzione Tipo di modello impostata su Tipo non specificato.
4. Selezionare Sfoglia>Sfoglia cartella> Selezionare la cartella deployment-torch/model>Avanti.
5. Configurare il nome del modello: mnist-classifier-torch. È possibile lasciare invariati i campi rimanenti.
6. Selezionare Registra.

Ora è il momento di creare uno script di assegnazione dei punteggi. Le distribuzioni batch richiedono uno script di assegnazione dei punteggi che indica come deve essere eseguito un determinato modello e come devono essere elaborati i dati di input. Gli endpoint batch supportano script creati in Python. In questo caso, viene distribuito un modello che legge i file di immagine che rappresentano cifre e restituisce la cifra corrispondente. Lo script di assegnazione dei punteggi è il seguente:

Nota

Per i modelli MLflow, Azure Machine Learning genera automaticamente lo script di assegnazione dei punteggi, quindi non è necessario specificarne uno. Se il modello è un modello MLflow, è possibile ignorare questo passaggio. Per altre informazioni sul funzionamento degli endpoint batch con modelli MLflow, vedere l'articolo Uso di modelli MLflow in distribuzioni batch.

Avviso

Se si distribuisce un modello di Machine Learning automatizzato (AutoML) in un endpoint batch, tenere presente che lo script di assegnazione punteggi fornito da AutoML funziona solo per gli endpoint online e non è concepito per l'esecuzione batch. Per informazioni su come creare uno script di assegnazione punteggi per una distribuzione batch, vedere Creare script di assegnazione punteggi per distribuzioni batch.

deployment-torch/code/batch_driver.py

import os
import pandas as pd
import torch
import torchvision
import glob
from os.path import basename
from mnist_classifier import MnistClassifier
from typing import List


def init():
    global model
    global device

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    # It is the path to the model folder
    model_path = os.environ["AZUREML_MODEL_DIR"]
    model_file = glob.glob(f"{model_path}/*/*.pt")[-1]

    model = MnistClassifier()
    model.load_state_dict(torch.load(model_file))
    model.eval()

    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")


def run(mini_batch: List[str]) -> pd.DataFrame:
    print(f"Executing run method over batch of {len(mini_batch)} files.")

    results = []
    with torch.no_grad():
        for image_path in mini_batch:
            image_data = torchvision.io.read_image(image_path).float()
            batch_data = image_data.expand(1, -1, -1, -1)
            input = batch_data.to(device)

            # perform inference
            predict_logits = model(input)

            # Compute probabilities, classes and labels
            predictions = torch.nn.Softmax(dim=-1)(predict_logits)
            predicted_prob, predicted_class = torch.max(predictions, axis=-1)

            results.append(
                {
                    "file": basename(image_path),
                    "class": predicted_class.numpy()[0],
                    "probability": predicted_prob.numpy()[0],
                }
            )

    return pd.DataFrame(results)

Creare un ambiente in cui verrà eseguita la distribuzione batch. L’ambiente deve includere i pacchetti azureml-core e azureml-dataset-runtime[fuse], necessari per gli endpoint batch, oltre a tutte le dipendenze richieste dal codice per l'esecuzione. In questo caso, le dipendenze sono state acquisite in un file conda.yaml:

deployment-torch/environment/conda.yaml
```
name: mnist-env
channels:
  - conda-forge
dependencies:
  - python=3.8.5
  - pip<22.0
  - pip:
    - torch==1.13.0
    - torchvision==0.14.0
    - pytorch-lightning
    - pandas
    - azureml-core
    - azureml-dataset-runtime[fuse]
```
Importante

I pacchetti azureml-core e azureml-dataset-runtime[fuse] sono necessari per le distribuzioni batch e devono essere inclusi nelle dipendenze dell'ambiente.

Specificare l'ambiente nel modo seguente:
La definizione dell'ambiente verrà inclusa nella definizione di distribuzione stessa come ambiente anonimo. Nella distribuzione verranno visualizzate le righe seguenti:
```
environment:
  name: batch-torch-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
```
Ottenere un riferimento all'ambiente:
```
env = Environment(
    name="batch-torch-py38",
    conda_file="deployment-torch/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest",
)
```
In Azure Machine Learning Studio seguire questa procedura:
1. Passare alla scheda Ambienti nel menu laterale.
2. Selezionare la scheda Ambienti personalizzati>Crea.
3. Immettere il nome dell'ambiente, in questo caso torch-batch-env.
4. Per Seleziona origine ambiente, selezionare Usa l'immagine Docker esistente con il file conda opzionale.
5. Per Percorso immagine del registro contenitori immettere mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04.
6. Selezionare Avanti per passare alla sezione “Personalizza”.
7. Copiare il contenuto del file deployment-torch/environment/conda.yaml dal repository GitHub nel portale.
8. Selezionare Avanti fino a visualizzare la pagina di revisione.
9. Selezionare Crea e attendere che l'ambiente sia pronto all'uso.
Avviso

Gli ambienti curati non sono supportati nelle distribuzioni batch. È necessario specificare il proprio ambiente. È sempre possibile usare l'immagine di base di un ambiente curato come il proprio per semplificare il processo.

Creare una definizione della distribuzione

deployment-torch/deployment.yml

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
name: mnist-torch-dpl
description: A deployment using Torch to solve the MNIST classification dataset.
endpoint_name: mnist-batch
type: model
model:
  name: mnist-classifier-torch
  path: model
code_configuration:
  code: code
  scoring_script: batch_driver.py
environment:
  name: batch-torch-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
compute: azureml:batch-cluster
resources:
  instance_count: 1
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 10
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 30
  error_threshold: -1
  logging_level: info

Nella tabella seguente sono descritte le proprietà chiave della distribuzione batch. Per lo schema YAML completo della distribuzione batch, vedere Schema YAML della distribuzione batch dell'interfaccia della riga di comando (v2).

Chiave	Descrizione
`name`	Nome della distribuzione.
`endpoint_name`	Nome dell'endpoint in cui creare la distribuzione.
`model`	Modello da usare per l'assegnazione dei punteggi batch. L'esempio definisce un modello inline usando `path`. Questa definizione consente il caricamento e la registrazione automatica dei file del modello con un nome e una versione generati automaticamente. Per altre opzioni, vedere lo Schema del modello. Come procedura consigliata per gli scenari di produzione, è necessario creare il modello separatamente e farvi riferimento qui. Per fare riferimento a un modello esistente, usare la sintassi `azureml:<model-name>:<model-version>`.
`code_configuration.code`	Directory locale che contiene tutto il codice sorgente Python per assegnare un punteggio al modello.
`code_configuration.scoring_script`	Il file Python nella directory `code_configuration.code`. Questo file deve avere una funzione `init()` e una funzione `run()`. Usare la funzione `init()` per qualunque preparazione dispendiosa o comune, ad esempio caricare il modello in memoria. `init()` verrà chiamato una sola volta all'inizio del processo. Usare `run(mini_batch)` per assegnare un punteggio a ogni voce; il valore di `mini_batch` è un elenco di percorsi di file. La funzione `run()` deve restituire un DataFrame Pandas o una matrice. Ogni elemento restituito indica un'esecuzione riuscita dell'elemento di input in `mini_batch`. Per altre informazioni su come creare uno script di assegnazione punteggi, vedere Informazioni sullo script di assegnazione punteggi.
`environment`	Ambiente per assegnare un punteggio al modello. L'esempio definisce un ambiente inline usando `conda_file` e `image`. Le dipendenze di `conda_file` verranno installate sopra `image`. L'ambiente verrà registrato automaticamente con un nome e una versione generati automaticamente. Per altre opzioni, vedere lo Schema dell'ambiente. Come procedura consigliata per gli scenari di produzione, è necessario creare l'ambiente separatamente e farvi riferimento qui. Per fare riferimento a un ambiente esistente, usare la sintassi `azureml:<environment-name>:<environment-version>`.
`compute`	Ambiente di calcolo per eseguire l'assegnazione dei punteggi batch. Nell'esempio viene usato il `batch-cluster` creato all'inizio, a cui viene fatto riferimento usando la sintassi `azureml:<compute-name>`.
`resources.instance_count`	Numero di istanze da usare per ogni processo di assegnazione dei punteggi batch.
`settings.max_concurrency_per_instance`	Il numero massimo di esecuzioni `scoring_script` parallele per ogni istanza.
`settings.mini_batch_size`	Il numero di file che `scoring_script` può elaborare in un'unica chiamata `run()`.
`settings.output_action`	Modalità di organizzazione dell'output nel file di output. `append_row` unirà tutti i risultati di output restituiti da `run()` in un unico file denominato `output_file_name`. `summary_only` non unisce i risultati dell'output e calcola solo `error_threshold`.
`settings.output_file_name`	Il nome del file di output di assegnazione punteggi batch per `append_row` `output_action`.
`settings.retry_settings.max_retries`	Il numero massimo di tentativi per `scoring_script` `run()` non riuscito.
`settings.retry_settings.timeout`	Il timeout in secondi per un `scoring_script` `run()` per l'assegnazione punteggi a un mini-batch.
`settings.error_threshold`	Numero di errori di assegnazione dei punteggi del file di input che devono essere ignorati. Se il numero di errori per l'intero input supera questo valore, il processo di assegnazione dei punteggi batch verrà terminato. L'esempio usa `-1`, che indica che è consentito un numero qualsiasi di errori senza terminare il processo di assegnazione dei punteggi batch.
`settings.logging_level`	livello di dettaglio del log. I valori in ordine crescente di livello di dettaglio sono: WARNING, INFO e DEBUG.
`settings.environment_variables`	Dizionario delle coppie nome-valore della variabile di ambiente da impostare per ogni processo di assegnazione dei punteggi batch.

deployment = ModelBatchDeployment(
    name="mnist-torch-dpl",
    description="A deployment using Torch to solve the MNIST classification dataset.",
    endpoint_name=endpoint_name,
    model=model,
    code_configuration=CodeConfiguration(
        code="deployment-torch/code/", scoring_script="batch_driver.py"
    ),
    environment=env,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        instance_count=2,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=30),
        logging_level="info",
    ),
)

La classe BatchDeployment consente di configurare le proprietà chiave seguenti di una distribuzione batch:

Chiave	Descrizione
`name`	Nome della distribuzione.
`endpoint_name`	Nome dell'endpoint in cui creare la distribuzione.
`model`	Modello da usare per la distribuzione. Questo valore può essere un riferimento a un modello con controllo delle versioni esistente nell'area di lavoro o a una specifica del modello inline.
`environment`	Ambiente da usare per la distribuzione. Questo valore può essere un riferimento a un ambiente con controllo delle versioni esistente nell'area di lavoro o a una specifica di ambiente inline (facoltativo per i modelli MLflow).
`code_configuration`	Configurazione su come eseguire l'inferenza per il modello (facoltativa per i modelli MLflow).
`code_configuration.code`	Percorso della directory del codice sorgente per l'assegnazione punteggi al modello.
`code_configuration.scoring_script`	Percorso relativo del file di assegnazione punteggi nella directory del codice sorgente.
`compute`	Nome della destinazione di calcolo in cui eseguire i processi di assegnazione punteggi batch.
`instance_count`	Numero di nodi da usare per ogni processo di assegnazione dei punteggi batch.
`settings`	La configurazione dell'inferenza della distribuzione modello.
`settings.max_concurrency_per_instance`	Il numero massimo di esecuzioni `scoring_script` parallele per ogni istanza.
`settings.mini_batch_size`	Il numero di file che `code_configuration.scoring_script` può elaborare in un'unica chiamata `run`().
`settings.retry_settings`	Impostazioni relative ai tentativi per l'assegnazione dei punteggi a ogni mini batch.
`settings.retry_settingsmax_retries`	Il numero massimo di tentativi per un mini-batch non riuscito o che ha raggiunto il timeout (l’impostazione predefinita è 3).
`settings.retry_settingstimeout`	Il timeout in secondi per l'assegnazione punteggi a un mini-batch (l’impostazione predefinita è 30).
`settings.output_action`	Modalità di organizzazione dell'output nel file di output. I valori consentiti sono `append_row` o `summary_only`. Il valore predefinito è `append_row`.
`settings.logging_level`	Livello di dettaglio del log. I valori consentiti sono `warning`, `info`, `debug`. Il valore predefinito è `info`.
`settings.environment_variables`	Dizionario delle coppie nome-valore della variabile di ambiente da impostare per ogni processo di assegnazione dei punteggi batch.

In Studio, seguire questa procedura:

Passare alla scheda Endpoint nel menu laterale.
Selezionare la scheda Endpoint batch>Crea.
Assegnare un nome all'endpoint, in questo caso mnist-batch. È possibile configurare il resto dei campi o lasciarli vuoti.
Selezionare Avanti per passare alla sezione “Modello”.
Selezionare il modello mnist-classifier-torch.
Selezionare Avanti per passare alla pagina “Distribuzione”.
Assegnare un nome alla distribuzione.
Per Azione output, accertarsi che sia selezionato Accoda riga.
Per Nome file di output, accertarsi che il file di output di assegnazione punteggi batch sia quello desiderato. Il valore predefinito è predictions.csv.
Per Dimensione mini-batch, modificare le dimensioni dei file che verranno inclusi in ogni mini-batch. Questa dimensione controllerà la quantità di dati ricevuti dallo script di assegnazione punteggi per ogni batch.
Per Timeout assegnazione punteggi (secondi), accertarsi di concedere alla distribuzione il tempo sufficiente per assegnare punteggi a un determinato batch di file. Se si aumenta il numero di file, in genere è necessario aumentare anche il valore di timeout. I modelli più dispendiosi (come quelli basati sul Deep Learning) possono richiedere valori elevati in questo campo.
Per Concorrenza massima per istanza, configurare il numero di executor per ogni istanza di ambiente di calcolo ottenuta nella distribuzione. Un numero più elevato garantisce un livello di parallelizzazione superiore, ma aumenta anche la pressione della memoria sull'istanza di ambiente di calcolo. Ottimizzare completamente questo valore con Dimensione batch ridotta.
Selezionare, quindi, Avanti per passare alla pagina “Codice + Ambiente”.
Per “Selezionare uno script di assegnazione punteggi per l'inferenza”, individuare e selezionare il file di script di assegnazione punteggi deployment-torch/code/batch_driver.py.
Nella sezione “Seleziona ambiente”, selezionare l'ambiente torch-batch-env creato in precedenza.
Selezionare Avanti per passare alla pagina "Calcolo".
Selezionare il cluster di elaborazione creato in un passaggio precedente.

Avviso

Il cluster Azure Kubernetes è supportato nelle distribuzioni batch, ma solo quando viene creato usando l'interfaccia della riga di comando di Azure ML o Python SDK.
Per Numero di istanze, immettere il numero di istanze di ambiente di calcolo desiderato per la distribuzione. In questo caso, usare 2.
Selezionare Avanti.

Creare la distribuzione:
Eseguire il codice seguente per creare una distribuzione batch nell'endpoint batch e impostarla come distribuzione predefinita.
```
az ml batch-deployment create --file deployment-torch/deployment.yml --endpoint-name $ENDPOINT_NAME --set-default
```
Suggerimento

Il parametro --set-default imposta la distribuzione appena creata come distribuzione predefinita dell'endpoint. È un modo pratico per creare una nuova distribuzione predefinita dell'endpoint, soprattutto per la prima creazione della distribuzione. Come procedura consigliata per gli scenari di produzione, è possibile creare una nuova distribuzione senza impostarla come predefinita. Accertarsi che la distribuzione funzioni come previsto, quindi aggiornare la distribuzione predefinita in un secondo momento. Per altre informazioni sull'implementazione di questo processo, vedere la sezione Distribuire un nuovo modello.
Usando MLClient creato in precedenza, creare la distribuzione nell'area di lavoro. Questo comando avvia la creazione della distribuzione e restituisce una risposta di conferma mentre la creazione della distribuzione è ancora in corso.
```
ml_client.begin_create_or_update(deployment).result()
```
Una volta completata la distribuzione, impostare la nuova distribuzione come distribuzione predefinita nell'endpoint:
```
endpoint = ml_client.batch_endpoints.get(endpoint_name)
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()
```
Nella procedura guidata fare clic su Crea, per avviare il processo di distribuzione.
Controllare i dettagli dell'endpoint e della distribuzione batch.
Usare show per controllare i dettagli dell'endpoint e della distribuzione. Per controllare una distribuzione batch, eseguire il codice seguente:
```
DEPLOYMENT_NAME="mnist-torch-dpl"
az ml batch-deployment show --name $DEPLOYMENT_NAME --endpoint-name $ENDPOINT_NAME
```
Per controllare una distribuzione batch, eseguire il codice seguente:
```
ml_client.batch_deployments.get(name=deployment.name, endpoint_name=endpoint.name)
```
Dopo aver creato l'endpoint batch, viene visualizzata la pagina dei dettagli dell'endpoint. È possibile trovare questa pagina anche seguendo questa procedura:
1. Passare alla scheda Endpoint nel menu laterale.
2. Selezionare la scheda Endpoint batch.
3. Selezionare l'endpoint batch da visualizzare.
4. Nella pagina Dettagli dell’endpoint vengono visualizzati i dettagli dell'endpoint insieme a tutte le distribuzioni disponibili nell’endpoint.

Eseguire endpoint batch e accedere ai risultati

La chiamata di un endpoint batch attiva un processo di assegnazione dei punteggi batch. Il processo name viene restituito dalla risposta alla chiamata e può essere usato per tenere traccia dello stato di assegnazione punteggi batch. Quando si eseguono modelli per l'assegnazione punteggi in endpoint batch, è necessario specificare il percorso dei dati di input in cui gli endpoint possono trovare i dati a cui assegnare punteggi. L'esempio seguente illustra come avviare un nuovo processo su dati di esempio del set di dati MNIST archiviato in un account di archiviazione di Azure.

È possibile eseguire e richiamare un endpoint batch usando l'interfaccia della riga di comando di Azure, Azure Machine Learning SDK o gli endpoint REST. Per altri dettagli su queste opzioni, vedere Creare processi e dati di input per endpoint batch.

Nota

Come funziona la parallelizzazione?

Le distribuzioni batch distribuiscono il lavoro a livello di file, il che significa che una cartella contenente 100 file con mini batch di 10 file genererà 10 batch di 10 file ciascuno. Tenere presente che ciò avviene indipendentemente dalle dimensioni dei file coinvolti. Se i file sono troppo grandi per essere elaborati in mini-batch di grandi dimensioni, è consigliabile suddividere i file in file più piccoli per ottenere un livello di parallelismo superiore o ridurre il numero di file per mini-batch. Al momento, la distribuzione batch non può tenere conto delle differenze in una distribuzione delle dimensioni del file.

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --input-type uri_folder --query name -o tsv)

Suggerimento

Qual è la differenza tra il parametro inputs e input quando si richiama un endpoint?

In generale, è possibile usare un parametro inputs = {} del dizionario con il metodo invoke per fornire un numero arbitrario di input necessari a un endpoint batch che contiene una distribuzione modello o una distribuzione pipeline.

Per una distribuzione modello, è possibile usare il parametro input come modo più breve per specificare la posizione dei dati di input per la distribuzione. Questo approccio funziona perché una distribuzione del modello accetta sempre un solo input di dati.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    deployment_name=deployment.name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
)

Passare alla scheda Endpoint nel menu laterale.
Selezionare la scheda Endpoint batch.
Selezionare l'endpoint batch appena creato.
Selezionare Crea processo.
Per Distribuzione, selezionare la distribuzione da eseguire.
Selezionare Avanti per passare alla pagina “Seleziona origine dati”.
Per “Tipo di origine dati”, selezionare Archivio dati.
Per “Archivio dati”, selezionare workspaceblobstore dal menu a discesa.
Per “Percorso”, immettere l'URL completo https://azuremlexampledata.blob.core.windows.net/data/mnist/sample.

Suggerimento

Questo percorso funziona solo perché è abilitato l’accesso pubblico per il percorso fornito. In generale, è necessario registrare l'origine dati come Archivio dati. Per informazioni dettagliate, vedere Accesso ai dati dai processi di endpoint batch.
Selezionare Avanti.
Selezionare Crea per avviare il processo.

Gli endpoint batch supportano la lettura di file o cartelle che si trovano in posizioni diverse. Per altre informazioni sui tipi supportati e su come specificarli, leggere Accesso ai dati da processi di endpoint batch.

Monitorare lo stato di esecuzione del processo batch

I processi di assegnazione dei punteggi batch richiedono in genere del tempo per elaborare l'intero set di input.

Il codice seguente controlla lo stato del processo e restituisce un collegamento allo studio di Azure Machine Learning per altri dettagli.

az ml job show -n $JOB_NAME --web

Il codice seguente controlla lo stato del processo e restituisce un collegamento allo studio di Azure Machine Learning per altri dettagli.

ml_client.jobs.get(job.name)

Controllare i risultati dell'assegnazione dei punteggi batch

Gli output del processo vengono archiviati nell'archiviazione nel cloud, nell'archiviazione BLOB predefinita dell'area di lavoro o nell'archiviazione specificata dall'utente. Per informazioni su come modificare le impostazioni predefinite, vedere Configurare il percorso di output. La procedura seguente consente di visualizzare i risultati di assegnazione punteggi in Azure Storage Explorer una volta completato il processo:

Eseguire il codice seguente per aprire il processo di assegnazione punteggi batch in Azure Machine Learning Studio. Il collegamento allo studio del processo è incluso anche nella risposta di invoke, come valore di interactionEndpoints.Studio.endpoint.
```
az ml job show -n $JOB_NAME --web
```
Nel grafico del processo selezionare il passaggio batchscoring.
Selezionare la scheda Output e log, quindi scegliere Mostra output dei dati.
In Output dei dati selezionare l'icona per aprire Storage Explorer.

I risultati di assegnazione dei punteggi in Storage Explorer sono simili alla pagina di esempio seguente:

Configurare il percorso di output

Per impostazione predefinita, i risultati dell’assegnazione punteggi batch vengono archiviati nell'archivio BLOB predefinito dell'area di lavoro, all'interno di una cartella denominata in base al nome del processo (un GUID generato dal sistema). È possibile configurare dove archiviare gli output di assegnazione dei punteggi quando si richiama l'endpoint batch.

Usare output-path per configurare qualsiasi cartella in un archivio dati registrato di Azure Machine Learning. La sintassi per --output-path equivale a --input quando si specifica una cartella, ovvero azureml://datastores/<datastore-name>/paths/<path-on-datastore>/. Usare --set output_file_name=<your-file-name> per configurare un nuovo nome di file di output.

OUTPUT_FILE_NAME=predictions_`echo $RANDOM`.csv
OUTPUT_PATH="azureml://datastores/workspaceblobstore/paths/$ENDPOINT_NAME"

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --output-path $OUTPUT_PATH --set output_file_name=$OUTPUT_FILE_NAME --query name -o tsv)

Usare params_override per configurare qualsiasi cartella in un archivio dati registrato di Azure Machine Learning. Solo gli archivi dati registrati sono supportati come percorsi di output. In questo esempio si userà l'archivio dati predefinito:

batch_ds = ml_client.datastores.get_default()

Dopo aver identificato l'archivio dati da usare, configurare l'output come indicato di seguito:

filename = f"predictions-{random.randint(0,99999)}.csv"

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
    params_override=[
        {"output_dataset.datastore_id": f"azureml:{batch_ds.id}"},
        {"output_dataset.path": f"/{endpoint_name}/"},
        {"output_file_name": filename},
    ],
)

Avviso

È necessario usare un percorso di output univoco. Se il file di output esiste, il processo di assegnazione dei punteggi batch avrà esito negativo.

Importante

A differenza degli input, gli output possono essere archiviati solo in archivi dati di Azure Machine Learning eseguiti in account di archiviazione BLOB.

Sovrascrivere la configurazione della distribuzione per ogni processo

Quando si richiama un endpoint batch, alcune impostazioni possono essere sovrascritte per usare al meglio le risorse di calcolo e migliorare le prestazioni. Le impostazioni seguenti possono essere configurate in base al processo:

Numero di istanze: usare questa impostazione per sovrascrivere il numero di istanze da richiedere al cluster di elaborazione. Ad esempio, per un volume maggiore di input di dati, è possibile usare più istanze per velocizzare l'assegnazione dei punteggi batch end-to-end.
Dimensione mini-batch: usare questa impostazione per sovrascrivere il numero di file da includere in ogni mini-batch. Il numero di mini-batch viene deciso in base al numero totale di file di input e dalle dimensioni del mini-batch. Dimensioni più piccole del mini-batch generano più mini-batch. I mini batch possono essere eseguiti in parallelo, ma potrebbe verificarsi un sovraccarico aggiuntivo di pianificazione e di chiamata.
È possibile sovrascrivere altre impostazioni, ad esempio Numero massimo di tentativi, Timeout e Soglia di errore. Queste impostazioni potrebbero influire sul tempo di assegnazione punteggi batch end-to-end per carichi di lavoro diversi.

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --mini-batch-size 20 --instance-count 5 --query name -o tsv)

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/"
    ),
    params_override=[{"mini_batch_size": "20"}, {"compute.instance_count": "5"}],
)

Aggiungere distribuzioni a un endpoint

Dopo aver creato un endpoint batch con una distribuzione, è possibile continuare a perfezionare il modello e aggiungere nuove distribuzioni. Gli endpoint batch continueranno a gestire la distribuzione predefinita durante lo sviluppo e la distribuzione di nuovi modelli nello stesso endpoint. Le distribuzioni non possono influire l'una sull'altra.

In questo esempio, si aggiunge una seconda distribuzione che usa un modello creato con Keras e TensorFlow per risolvere lo stesso problema MNIST.

Aggiungere una seconda distribuzione

Creare un ambiente in cui verrà eseguita la distribuzione batch. Includere nell'ambiente qualsiasi dipendenza richiesta dal codice per l'esecuzione. È anche possibile aggiungere la libreria azureml-core, perché è necessaria per il funzionamento delle distribuzioni batch. La definizione di ambiente seguente include le librerie necessarie per eseguire un modello con TensorFlow.
La definizione dell'ambiente viene inclusa nella definizione della distribuzione stessa come ambiente anonimo.
```
environment:
  name: batch-tensorflow-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
```
Ottenere un riferimento all'ambiente:
```
env = Environment(
    name="batch-tensorflow-py38",
    conda_file="deployment-keras/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest",
)
```
1. Passare alla scheda Ambienti nel menu laterale.
2. Selezionare la scheda Ambienti personalizzati>Crea.
3. Immettere il nome dell'ambiente, in questo caso keras-batch-env.
4. Per Seleziona origine ambiente, selezionare Usa l'immagine Docker esistente con il file conda opzionale.
5. Per Percorso immagine del registro contenitori immettere mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04.
6. Selezionare Avanti per passare alla sezione “Personalizza”.
7. Copiare il contenuto del file deployment-keras/environment/conda.yaml dal repository GitHub nel portale.
8. Selezionare Avanti fino a visualizzare la pagina di revisione.
9. Selezionare Crea e attendere che l'ambiente sia pronto all'uso.
Il file conda usato è simile al seguente:

deployment-keras/environment/conda.yaml
```
name: tensorflow-env
channels:
  - conda-forge
dependencies:
  - python=3.8.5
  - pip
  - pip:
    - pandas
    - tensorflow
    - pillow
    - azureml-core
    - azureml-dataset-runtime[fuse]
```

Creare uno script di assegnazione di punteggi per il modello:

deployment-keras/code/batch_driver.py

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from typing import List
from os.path import basename
from PIL import Image
from tensorflow.keras.models import load_model


def init():
    global model

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)


def run(mini_batch: List[str]) -> pd.DataFrame:
    print(f"Executing run method over batch of {len(mini_batch)} files.")

    results = []
    for image_path in mini_batch:
        data = Image.open(image_path)
        data = np.array(data)
        data_batch = tf.expand_dims(data, axis=0)

        # perform inference
        pred = model.predict(data_batch)

        # Compute probabilities, classes and labels
        pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
        pred_class = tf.math.argmax(pred, axis=-1).numpy()

        results.append(
            {
                "file": basename(image_path),
                "class": pred_class[0],
                "probability": pred_prob,
            }
        )

    return pd.DataFrame(results)

Creare una definizione della distribuzione
deployment-keras/deployment.yml
```
$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
name: mnist-keras-dpl
description: A deployment using Keras with TensorFlow to solve the MNIST classification dataset.
endpoint_name: mnist-batch
type: model
model: 
  name: mnist-classifier-keras
  path: model
code_configuration:
  code: code
  scoring_script: batch_driver.py
environment:
  name: batch-tensorflow-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
compute: azureml:batch-cluster
resources:
  instance_count: 1
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 10
  output_action: append_row
  output_file_name: predictions.csv
```
```
deployment_keras = ModelBatchDeployment(
    name="mnist-keras-dpl",
    description="A deployment using Keras to solve the MNIST classification dataset.",
    endpoint_name=endpoint_name,
    model=model,
    code_configuration=CodeConfiguration(
        code="deployment-keras/code/", scoring_script="batch_driver.py"
    ),
    environment=env,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        instance_count=2,
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=30),
        logging_level="info",
    ),
)
```
1. Passare alla scheda Endpoint nel menu laterale.
2. Selezionare la scheda Endpoint batch.
3. Selezionare l'endpoint batch esistente in cui si vuole aggiungere la distribuzione.
4. Selezionare Aggiungi distribuzione.
5. Selezionare Avanti per passare alla pagina “Modello”.
6. Nell'elenco dei modelli, selezionare il modello mnist, quindi selezionare Avanti.
7. Nella pagina di configurazione della distribuzione assegnare un nome alla distribuzione.
8. Annullare la selezione per l'opzione: Rendi predefinita questa nuova distribuzione per i processi batch.
9. Per Azione output, accertarsi che sia selezionato Accoda riga.
10. Per Nome file di output, accertarsi che il file di output di assegnazione punteggi batch sia quello desiderato. Il valore predefinito è predictions.csv.
11. Per Dimensione mini-batch, modificare le dimensioni dei file che verranno inclusi in ogni mini-batch. Ciò controllerà la quantità di dati ricevuti dallo script di assegnazione punteggi per ogni batch.
12. Per Timeout assegnazione punteggi (secondi), accertarsi di concedere alla distribuzione il tempo sufficiente per assegnare punteggi a un determinato batch di file. Se si aumenta il numero di file, in genere è necessario aumentare anche il valore di timeout. I modelli più dispendiosi (come quelli basati sul Deep Learning) possono richiedere valori elevati in questo campo.
13. Per Concorrenza massima per istanza, configurare il numero di executor per ogni istanza di ambiente di calcolo ottenuta nella distribuzione. Un numero più elevato garantisce un livello di parallelizzazione superiore, ma aumenta anche la pressione della memoria sull'istanza di ambiente di calcolo. Ottimizzare completamente questo valore con Dimensione batch ridotta.
14. Selezionare Avanti per passare alla pagina “Codice + Ambiente”.
15. Per Selezionare uno script di assegnazione punteggi per l'inferenza, individuare e selezionare il file di script di assegnazione punteggi deployment-keras/code/batch_driver.py.
16. Per Seleziona ambiente, selezionare l'ambiente creato in un passaggio precedente.
17. Selezionare Avanti.
18. Nella pagina Ambiente di calcolo, selezionare il cluster di elaborazione creato in un passaggio precedente.
19. Per Numero di istanze, immettere il numero di istanze di ambiente di calcolo desiderato per la distribuzione. In questo caso, usare 2.
20. Selezionare Avanti.
Creare la distribuzione:
Eseguire il codice seguente per creare una distribuzione batch nell'endpoint batch e impostarla come distribuzione predefinita.
```
az ml batch-deployment create --file deployment-keras/deployment.yml --endpoint-name $ENDPOINT_NAME
```
Suggerimento

In questo caso manca il parametro --set-default. Come procedura consigliata per gli scenari di produzione, creare una nuova distribuzione senza impostarla come predefinita. Quindi verificarla e aggiornare la distribuzione predefinita in un secondo momento.
Usando MLClient creato in precedenza, creare la distribuzione nell'area di lavoro. Questo comando avvia la creazione della distribuzione e restituisce una risposta di conferma mentre la creazione della distribuzione è ancora in corso.
```
ml_client.begin_create_or_update(deployment_keras).result()
```
Nella procedura guidata fare clic su Crea, per avviare il processo di distribuzione.

Testare una distribuzione batch non predefinita

Per testare la nuova distribuzione non predefinita, è necessario conoscere il nome della distribuzione da eseguire.

DEPLOYMENT_NAME="mnist-keras-dpl"
JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --deployment-name $DEPLOYMENT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --input-type uri_folder --query name -o tsv)

Tenere presente che --deployment-name viene usato per specificare la distribuzione da eseguire. Questo parametro consente invoke per una distribuzione non predefinita senza aggiornare la distribuzione predefinita dell'endpoint batch.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    deployment_name=deployment_keras.name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
)

Tenere presente che deployment_name viene usato per specificare la distribuzione da eseguire. Questo parametro consente invoke per una distribuzione non predefinita senza aggiornare la distribuzione predefinita dell'endpoint batch.

Aggiornare la distribuzione batch predefinita

Anche se è possibile richiamare una distribuzione specifica all'interno di un endpoint, generalmente si desidera richiamare l'endpoint stesso e consentire all'endpoint di decidere quale distribuzione usare — la distribuzione predefinita. È possibile modificare la distribuzione predefinita, e quindi modificare il modello che gestisce la distribuzione, senza modificare il contratto con l'utente che richiama l'endpoint. Usare il codice seguente per aggiornare la distribuzione predefinita:

az ml batch-endpoint update --name $ENDPOINT_NAME --set defaults.deployment_name=$DEPLOYMENT_NAME

endpoint = ml_client.batch_endpoints.get(endpoint_name)
endpoint.defaults.deployment_name = deployment_keras.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()

Eliminare l'endpoint e la distribuzione batch

Se la vecchia distribuzione batch non verrà utilizzata, eliminarla eseguendo il codice seguente. --yes viene usato per confermare l'eliminazione.

az ml batch-deployment delete --name mnist-torch-dpl --endpoint-name $ENDPOINT_NAME --yes

Eseguire il codice seguente per eliminare l'endpoint batch e tutte le distribuzioni sottostanti. I processi di assegnazione dei punteggi batch non verranno eliminati.

az ml batch-endpoint delete --name $ENDPOINT_NAME --yes

Se la vecchia distribuzione batch non verrà utilizzata, eliminarla eseguendo il codice seguente.

ml_client.batch_deployments.begin_delete(
    endpoint_name=endpoint_name, name=deployment.name
).result()

Eseguire il codice seguente per eliminare l'endpoint batch e tutte le distribuzioni sottostanti. I processi di assegnazione dei punteggi batch non verranno eliminati.

ml_client.batch_endpoints.begin_delete(name=endpoint_name)

Condividi tramite

Distribuire modelli per l'assegnazione dei punteggi negli endpoint batch

Prerequisiti

Clonare il repository di esempi

Preparare il sistema

Connettersi all'area di lavoro

Creare l'ambiente di calcolo

Creare un endpoint batch

Creare una distribuzione batch

Eseguire endpoint batch e accedere ai risultati

Monitorare lo stato di esecuzione del processo batch

Controllare i risultati dell'assegnazione dei punteggi batch

Configurare il percorso di output

Sovrascrivere la configurazione della distribuzione per ogni processo

Aggiungere distribuzioni a un endpoint

Aggiungere una seconda distribuzione

Testare una distribuzione batch non predefinita

Aggiornare la distribuzione batch predefinita

Eliminare l'endpoint e la distribuzione batch

Commenti e suggerimenti

Risorse aggiuntive

Condividi tramite

Distribuire modelli per l'assegnazione dei punteggi negli endpoint batch

Prerequisiti

Clonare il repository di esempi

Preparare il sistema

Connettersi all'area di lavoro

Creare l'ambiente di calcolo

Creare un endpoint batch

Creare una distribuzione batch

Eseguire endpoint batch e accedere ai risultati

Monitorare lo stato di esecuzione del processo batch

Controllare i risultati dell'assegnazione dei punteggi batch

Configurare il percorso di output

Sovrascrivere la configurazione della distribuzione per ogni processo

Aggiungere distribuzioni a un endpoint

Aggiungere una seconda distribuzione

Testare una distribuzione batch non predefinita

Aggiornare la distribuzione batch predefinita

Eliminare l'endpoint e la distribuzione batch

Contenuto correlato

Commenti e suggerimenti

Risorse aggiuntive