Créer des travaux et des données d’entrée pour les points de terminaison de lot

Article
02/04/2025

Lorsque vous utilisez des points de terminaison de traitement par lots dans Azure Machine Learning, vous pouvez effectuer des opérations de traitement par lots longues sur de grandes quantités de données d’entrée. Les données peuvent être situées à différents endroits, par exemple dans des régions différentes. Certains types de points de terminaison de lot peuvent également recevoir des paramètres de littéraux en tant qu’entrées.

Cet article explique comment spécifier des entrées de paramètres pour les points de terminaison de lot et créer des travaux de déploiement. Le processus prend en charge l’utilisation des données provenant de différentes sources, telles que les ressources de données, les magasins de données, les comptes de stockage et les fichiers locaux.

Prérequis

Un point de terminaison par lots et un déploiement. Pour créer ces ressources, voir Déployer des modèles MLflow dans des déploiements par lots dans Azure Machine Learning.
Des autorisations pour exécuter un déploiement de point de terminaison par lots. Vous pouvez utiliser les rôles de scientifique des données AzureML, de Contributeur(-trice) et de propriétaire pour exécuter un déploiement. Pour examiner les autorisations spécifiques requises pour les définitions de rôles personnalisés, voir Autorisation sur les terminaux de traitement par lots.
Informations d’identification pour appeler un point de terminaison. Pour plus d’informations, consultez Établir une authentification.
Accès en lecture aux données d'entrée à partir de la grappe de calcul où le point final est déployé.

Conseil

Certaines situations nécessitent l’utilisation d’un magasin de données sans informations d’identification ou d’un compte de stockage Azure externe en tant qu’entrée de données. Dans ces scénarios, veillez à configurer des clusters de calcul pour l’accès aux données, car l’identité managée du cluster de calcul est utilisée pour monter le compte de stockage. Le contrôle d'accès reste granulaire, car l'identité du travail (invoker) est utilisée pour lire les données sous-jacentes.

Établir l’authentification

Pour appeler un point de terminaison, vous avez besoin d’un jeton Microsoft Entra valide. Lorsque vous avez appelé un point de terminaison, Azure Machine Learning crée un travail de déploiement par lots sous l’identité associée au jeton.

Si vous utilisez Azure Machine Learning CLI (v2) ou Azure Machine Learning SDK for Python (v2) pour invoquer des points de terminaison, vous n'avez pas besoin d'obtenir manuellement le jeton Microsoft Entra. Pendant la connexion, le système authentifie votre identité utilisateur. Il récupère et transmet également le jeton pour vous.
Si vous utilisez l’API REST pour appeler des points de terminaison, vous devez obtenir le jeton manuellement.

Vous pouvez utiliser vos propres informations d’identification pour l’appel, comme décrit dans les procédures suivantes.

Utilisez Azure CLI pour vous connecter avec l’authentification interactive ou par code d’appareil :

az login

Utilisez le kit de développement logiciel (SDK) Azure Machine Learning pour Python pour vous connecter :

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(DefaultAzureCredential())

Si votre configuration s’exécute en dehors d’une instance de calcul Azure Machine Learning, vous devez spécifier l’espace de travail où le point de terminaison est déployé :

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

subscription_id = "<subscription-ID>"
resource_group = "<resource-group-name>"
workspace = "<workspace-name>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

Le moyen le plus facile d’obtenir un jeton valide pour votre compte utilisateur consiste à utiliser Azure CLI. Dans une console, exécutez la commande Azure CLI suivante :

az account get-access-token --resource https://ml.azure.com --query "accessToken" --output tsv

Conseil

Lorsque vous utilisez des requêtes REST, nous vous recommandons d’utiliser un principal de service pour appeler des points de terminaison batch. Pour plus d’informations, consultez Exécution de travaux avec un principal de service.

Pour plus d’informations sur différents types d’informations d’identification, consultez Comment exécuter des travaux à l’aide de différents types d’informations d’identification.

Créer des travaux de base

Pour créer un travail à partir d’un point de terminaison de lot, vous appelez le point de terminaison. L’appel peut être effectué avec Azure Machine Learning CLI, le kit SDK Azure Machine Learning pour Python, ou un appel d’API REST.

Les exemples suivants montrent les principes de base d’un appel de point de terminaison de lot qui reçoit un seul dossier de données d’entrée à traiter. Pour obtenir des exemples qui impliquent plusieurs entrées et sorties, consultez Présentation des entrées et sorties.

Utilisez l’opération invoke sous des points de terminaison de lot :

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
                            --input https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data

Utilisez la méthode MLClient.batch_endpoints.invoke() pour appeler un point de terminaison de traitement par lots. Dans le code suivant, endpoint est un objet de point de terminaison.

from azure.ai.ml import Input

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": Input(path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data")
    }
)

Exécutez une requête POST sur l’URL d’appel du point de terminaison. Pour obtenir l’URL d’appel, accédez à Azure Machine Learning studio et ouvrez la page de détails du point de terminaison.

Utilisez le corps de texte suivant dans votre requête :

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        }
    }
}

Créez votre requête :

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

Appeler un déploiement spécifique

Les points de terminaison par lots peuvent héberger plusieurs déploiements sous le même point de terminaison. Le point de terminaison par défaut est utilisé, sauf si l’utilisateur le spécifiez autrement. Vous pouvez utiliser les procédures suivantes pour modifier le déploiement que vous utilisez.

Utilisez l’argument --deployment-name ou -d pour spécifier le nom du déploiement :

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
                            --deployment-name $DEPLOYMENT_NAME \
                            --input https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data

Utilisez le paramètre deployment_name pour spécifier le nom du déploiement. Dans le code suivant, deployment est un objet de déploiement.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    deployment_name=deployment.name,
    inputs={
        "heart_data": Input(path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data")
    }
)

Utilisez le corps de texte suivant dans votre requête :

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        }
    }
}

Ajoutez la clé d’en-tête azureml-model-deployment à votre requête. Pour sa valeur, utilisez le nom du déploiement que vous souhaitez appeler.

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
azureml-model-deployment: <deployment-name>

Configurer les propriétés du travail

Vous pouvez configurer certaines propriétés de travail au moment de l’appel.

Remarque

Actuellement, vous ne pouvez configurer les propriétés des travaux que dans les points de terminaison batch avec les déploiements de composants de pipeline.

Configurer le nom de l’expérience

Appliquez les procédures suivantes pour configurer le nom de votre expérience.

Utilisez l’argument --experiment-name pour spécifier le nom de l’expérience :

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
                            --experiment-name "my-batch-job-experiment" \
                            --input https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data

Utilisez le paramètre experiment_name pour spécifier le nom de l’expérience :

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    experiment_name="my-batch-job-experiment",
    inputs={
        "heart_data": Input(path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"),
    }
)

Indiquez le nom de l’expérience en utilisant la clé experimentName dans la section properties :

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        },
        "properties":
        {
            "experimentName": "my-batch-job-experiment"
        }
    }
}

Créez votre requête :

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

Présentation des entrées et des sorties

Les points de terminaison par lots fournissent une API durable que les consommateurs peuvent utiliser pour créer des programmes de traitement par lots. La même interface peut être utilisée pour spécifier les entrées et les sorties attendues par votre déploiement. Utilisez des entrées pour transmettre les informations dont votre point de terminaison a besoin pour effectuer le travail.

Diagramme qui montre la façon dont les entrées et sorties sont utilisées dans des points de terminaison par lots.

Les points de terminaison par lots prennent en charge deux types d’entrées :

Entrées de données ou pointeurs vers un emplacement de stockage spécifique ou une ressource Azure Machine Learning
Entrées littérales ou valeurs littérales, comme des nombres ou des chaînes, que vous souhaitez transmettre au travail

Le nombre et le type d’entrées et de sorties dépendent du type de déploiement par lots. Les modèles de déploiement nécessitent toujours une entrée de données et produisent une sortie de données. Les entrées littérales ne sont pas prises en charge dans les modèles de déploiements. En revanche, les déploiements de composants de pipeline offrent une structure plus générale pour la création de points de terminaison. Dans un déploiement de composant de pipeline, vous pouvez spécifier n’importe quel nombre d’entrées de données, d’entrées littérales et de sorties.

Le tableau suivant récapitule les entrées et sorties pour les déploiements par lots :

Type de déploiement	Nombre d’entrées	Types d’entrée pris en charge	Nombre de sorties	Types de sortie pris en charge
Déploiement de modèle	1	Entrées de données	1	Sorties de données
Déploiement de composant de pipeline	0-N	Entrées de données et entrées de littéral	0-N	Sorties de données

Conseil

Les entrées et sorties sont toujours nommées. Chaque nom sert de clé pour cerner les données et transmettre la valeur pendant l’appel. Les déploiements de modèles nécessitant toujours une entrée et une sortie, les noms sont ignorés lors de l'invocation dans les modèles de déploiements. Vous pouvez attribuer le nom qui correspond le mieux à votre cas d’usage, par exemple sales_estimation.

Explorer les entrées de données

Les entrées de données désignent les entrées qui pointent vers un emplacement où les données sont placées. Les points de terminaison de lot consommant généralement de grandes quantités de données, vous ne pouvez pas transmettre les données d’entrée dans le cadre de la demande d’appel. Au lieu de cela, vous devez spécifiez l’emplacement où le point de terminaison par lots doit se rendre pour rechercher les données. Les données d’entrée sont montées et diffusées en continu sur l’instance de calcul cible pour améliorer les performances.

Les points de terminaison Batch peuvent lire les fichiers situés dans les types de stockage suivants :

Ressources de données Azure Machine Learning, y compris les types de dossier (uri_folder) et de fichier (uri_file).
Magasins de données Azure Machine Learning, y compris Stockage Blob Azure, Azure Data Lake Storage Gen1 et Azure Data Lake Storage Gen2.
Comptes de stockage Azure, y compris Stockage Blob, Data Lake Storage Gen1, et Data Lake Storage Gen2.
Dossiers et fichiers de données locaux, lorsque vous utilisez Azure Machine Learning CLI ou Azure Machine Learning SDK for Python pour invoquer des points de terminaison. Mais les données locales sont téléchargées dans le magasin de données par défaut de votre espace de travail Azure Machine Learning.

Important

Note relative à la suppression de fonctionnalités : les ressources de données de type FileDataset (V1) sont déconseillés et seront mis hors service à l’avenir. Les points de terminaison de lot existants qui s’appuient sur cette fonctionnalité continueront de fonctionner. Toutefois, il n’existe aucune prise en charge des jeux de données V1 dans les points de terminaison de traitement par lots créés avec :

Versions d’Azure Machine Learning CLI v2 généralement disponibles (2.4.0 et versions ultérieures).
Versions de l’API REST généralement disponibles (01-05-2022 et versions ultérieures).

Explorer les entrées littérales

Les entrées de littéral font référence aux entrées qui peuvent être représentées et résolues au moment de l’appel, telles que les chaînes, les nombres et les valeurs booléennes. Vous utilisez généralement des entrées de littéral pour transmettre des paramètres à votre point de terminaison dans le cadre d’un déploiement de composants de pipeline. Les points de terminaison par lots prennent en charge les types de littéral suivants :

string
boolean
float
integer

Les entrées littérales ne sont prises en charge que dans les déploiements de composants de pipeline. Pour savoir comment spécifier des points finaux littéraux, voir Créer des travaux avec des entrées littérales.

Explorer les sorties de données

Les sorties de données font référence à l’emplacement où les résultats d’un programme de traitement par lots sont placés. Chaque sortie a un nom identifiable, et Azure Machine Learning attribue automatiquement un chemin d’accès unique à chaque sortie nommée. Vous pouvez spécifier un autre chemin d’accès, le cas échéant.

Important

Les points de terminaison Batch prennent uniquement en charge l’écriture de sorties dans les magasins de données du Stockage Blob. Si vous devez écrire sur un compte de stockage dont les espaces de noms hiérarchiques sont activés, tel que Data Lake Storage Gen2, vous pouvez enregistrer le service de stockage en tant que magasin de données de Stockage Blob, car les services sont entièrement compatibles. De cette façon, vous pouvez écrire des sorties de points de terminaison de lot vers Data Lake Storage Gen2.

Créer des tâches avec des entrées de données

Les exemples suivants montrent comment créer des tâches en utilisant des entrées de données à partir de ressources de données, magasins de données et comptes de Stockage Azure.

Utilisez la saisie de données à partir d’une ressource de données

Les ressources de données Azure Machine Learning (anciennement appelées jeux de données) sont prises en charge comme entrées pour les travaux. Suivez ces étapes pour exécuter un travail de point de terminaison par lot qui utilise des données d'entrée stockées dans une ressource de données enregistrée dans Azure Machine Learning.

Avertissement

Les ressources de données de type Table (MLTable) ne sont actuellement pas prises en charge.

Créez la ressource de données. Dans cet exemple, il se compose d’un dossier qui contient plusieurs fichiers CSV. Vous utilisez des points de terminaison de traitement par lots pour traiter les fichiers en parallèle. Vous pouvez ignorer cette étape si vos données sont déjà inscrites en tant que ressource de données.
1. Créez une définition de ressource de données dans un fichier YAML nommé heart-data.yml :
```
$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: heart-data
description: An unlabeled data asset for heart classification.
type: uri_folder
path: data
```
2. Créez la ressource de données :
```
az ml data create -f heart-data.yml
```
1. Créez une définition de ressource de données :
```
from azure.ai.ml.constants import AssetTypes
from azure.ai.ml.entities import Data

data_path = "heart-classifier-mlflow/data"
data_asset_name = "heart-data"

heart_data_object = Data(
    path=data_path,
    type=AssetTypes.URI_FOLDER,
    description="An unlabeled data asset for heart classification",
    name=data_asset_name
)
```
2. Créez la ressource de données :
```
ml_client.data.create_or_update(heart_data_object)
```
  Pour récupérer la ressource de données nouvellement créée, utilisez la commande suivante :
```
heart_data_asset = ml_client.data.get(name=data_asset_name, label="latest")
```
Utilisez Azure Machine Learning CLI ou Azure Machine Learning SDK for Python pour créer la ressource de données.
Configurez l’entrée :
```
DATA_ASSET_ID=$(az ml data show -n heart-data --label latest | jq -r .id)
```
```
input = Input(path=heart_data_asset.id)
```
Recherchez les valeurs suivantes, puis construisez l’ID de ressource de données :
- Identifiant d’abonnement
- Nom du groupe ressources
- Nom de l’espace de travail
- Nom de la ressource de données
- Une version de la ressource de données
L’ID de ressource de données a le format /subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/data/<data-asset-name>/versions/<data-asset-version>.
Exécutez le point de terminaison :
Utilisez l’argument --set pour spécifier l’entrée. Remplacez tout d’abord les traits d’union dans le nom de la ressource de données par des caractères de soulignement. Les clés ne peuvent contenir que des caractères alphanumériques et des traits de soulignement.
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.heart_data.type="uri_folder" inputs.heart_data.path=$DATA_ASSET_ID
```
Pour un point de terminaison qui sert un déploiement de modèle, vous pouvez utiliser l’argument --input pour spécifier l’entrée de données, car un modèle de déploiement nécessite toujours une seule entrée de données.
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --input $DATA_ASSET_ID
```
L’argument --set a tendance à produire de longues commandes lorsque vous spécifiez plusieurs entrées. Dans ce cas, vous pouvez répertorier vos entrées dans un fichier, puis faire référence au fichier lorsque vous appelez votre point de terminaison. Par exemple, vous pouvez créer un fichier YAML nommé inputs.yml qui contient les lignes suivantes :
```
inputs:
  heart_data:
    type: uri_folder
    path: /subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/data/heart-data/versions/1
```
Vous pouvez ensuite exécuter la commande suivante, qui utilise l’argument --file pour spécifier les entrées :
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml
```
Appelez la invokeméthode et utilisez le inputs paramètre pour spécifier les entrées requises :
```
job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": input
    }
)
```
Pour simplifier l’invokeappel au modèle de déploiement, utilisez le input paramètre pour spécifier l'emplacement des données d'entrée :
```
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input
)
```
Conseil

Quelle est la différence entre les paramètres inputs et input lorsque vous appelez un point de terminaison ?

En général, vous pouvez utiliser un paramètre inputs = {} de dictionnaire avec la méthode invoke pour fournir un nombre arbitraire d’entrées nécessaires à un point de terminaison de lot qui contient un déploiement de modèle ou un déploiement de pipeline.

Pour un déploiement de modèle, vous pouvez utiliser le paramètre input comme moyen plus court pour spécifier l’emplacement des données d’entrée pour le déploiement. Cette approche fonctionne car un déploiement de modèle ne prend toujours qu’une seule entrée de données.
Utilisez le corps de texte suivant dans votre requête :
```
{
    "properties": {
        "InputData": {
            "heart_data": {
                "JobInputType" : "UriFolder",
                "Uri": "<data-asset-ID>"
            }
        }
    }
}
```
Créez votre requête :
```
POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
```

Utilisez la saisie de données à partir d’un magasin de données

Vos tâches de déploiement par lots peuvent faire directement référence aux données qui se trouvent dans les magasins de données enregistrés d'Azure Machine Learning. Dans cet exemple, vous chargez d’abord des données dans un magasin de données dans votre espace de travail Azure Machine Learning. Ensuite, vous exécutez un déploiement par lots sur ces données.

Cet exemple utilise le magasin de données par défaut, mais vous pouvez utiliser un autre magasin de données. Dans n’importe quel espace de travail Azure Machine Learning, le nom du magasin de données blob par défaut est workspaceblobstore. Si vous souhaitez utiliser un autre magasin de données dans les étapes suivantes, remplacez workspaceblobstore par le nom de votre magasin de données préféré.

Chargez des échantillons de données dans le magasin de données. Les échantillons de données sont disponibles dans le référentiel azureml-examples . Vous trouverez les données dans le kit sdk sdk/python/endpoints/batch/deploy-models/heart-classifier-mlflow/data dossier de ce référentiel.
1. Dans Azure Machine Learning studio, ouvrez la page ressources de données de votre magasin de données d’objets blob par défaut, puis recherchez le nom de son conteneur d’objets blob.
2. Utilisez un outil tel que l’Explorateur Stockage Azure ou AzCopy pour charger les exemples de données dans un dossier nommé heart-disease-uci-unlabeled dans ce conteneur.
Configurez les informations d’entrée :
Placez le chemin d’accès du fichier dans la variable INPUT_PATH :
```
DATA_PATH="heart-disease-uci-unlabeled"
INPUT_PATH="azureml://datastores/workspaceblobstore/paths/$DATA_PATH"
```
Placez le chemin d’accès du fichier dans la variable input :
```
data_path = "heart-disease-uci-unlabeled"
input = Input(type=AssetTypes.URI_FOLDER, path=f"azureml://datastores/workspaceblobstore/paths/{data_path}")
```
Si vos données sont dans un fichier, remplacez l’assignation de type d’entrée par type=AssetTypes.URI_FILE.
Utilisez le corps de texte suivant dans votre requête. Remplacez d’abord les espaces réservés par des valeurs appropriées. Remplacez l’espace réservé <data-path> par heart-disease-uci-unlabeled.
```
{
    "properties": {
        "InputData": {
            "heart_data": {
                "JobInputType" : "UriFolder",
                "Uri": "/subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/datastores/workspaceblobstore/paths/<data-path>"
            }
        }
    }
}
```
Si vos données se trouvent dans un fichier, utilisez le type UriFile de la valeur JobInputType.
Notez que le dossier paths fait partie du chemin d’accès d’entrée. Ce format indique que la valeur qui suit est un chemin d’accès.
Exécutez le point de terminaison :
Utilisez l’argument --set pour spécifier l’entrée :
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.heart_data.type="uri_folder" inputs.heart_data.path=$INPUT_PATH
```
Pour un point de terminaison qui sert un déploiement de modèle, vous pouvez utiliser l’argument --input pour spécifier l’entrée de données, car un modèle de déploiement nécessite toujours une seule entrée de données.
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --input $INPUT_PATH --input-type uri_folder
```
L’argument --set a tendance à produire de longues commandes lorsque vous spécifiez plusieurs entrées. Dans ce cas, vous pouvez répertorier vos entrées dans un fichier, puis faire référence au fichier lorsque vous appelez votre point de terminaison. Par exemple, vous pouvez créer un fichier YAML nommé inputs.yml qui contient les lignes suivantes :
```
inputs:
  heart_data:
    type: uri_folder
    path: azureml://datastores/workspaceblobstore/paths/<data-path>
```
Si vos données sont dans un fichier, utilisez plutôt le type uri_file pour l’entrée.

Vous pouvez ensuite exécuter la commande suivante, qui utilise l’argument --file pour spécifier les entrées :
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml
```
Appelez la méthode invoke en utilisant le paramètre inputs pour spécifier les entrées requises :
```
job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": input
    }
)
```
Pour simplifier l’invokeappel au modèle de déploiement, utilisez le input paramètre pour spécifier l'emplacement des données d'entrée :
```
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input
)
```
Conseil

Quelle est la différence entre les paramètres inputs et input lorsque vous appelez un point de terminaison ?

En général, vous pouvez utiliser un paramètre inputs = {} de dictionnaire avec la méthode invoke pour fournir un nombre arbitraire d’entrées nécessaires à un point de terminaison de lot qui contient un déploiement de modèle ou un déploiement de pipeline.

Pour un déploiement de modèle, vous pouvez utiliser le paramètre input comme moyen plus court pour spécifier l’emplacement des données d’entrée pour le déploiement. Cette approche fonctionne car un déploiement de modèle ne prend toujours qu’une seule entrée de données.
Créez votre requête :
```
POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
```

Utiliser des données d'entrée provenant d'un compte de stockage Azure

Les points de terminaison par lots Azure Machine Learning peuvent lire des données à partir d’emplacements cloud dans les comptes de stockage Azure publics et privés. Effectuez les étapes suivantes pour exécuter un travail de point de terminaison de lot avec des données dans un compte de stockage.

Pour en savoir plus sur les configurations supplémentaires requises pour lire des données à partir de comptes de stockage, consultez Configurer des clusters de calcul pour l’accès aux données.

Configurez l’entrée :

Définissez la variable INPUT_DATA :

INPUT_DATA="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"

Si vos données se situent dans un fichier, utilisez un format similaire à celui suivant pour définir le chemin d’accès d’entrée :

INPUT_DATA="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv"

Définissez la variable input :

input = Input(
    type=AssetTypes.URI_FOLDER, 
    path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
)

Si vos données sont dans un fichier, remplacez l’assignation de type d’entrée par type=AssetTypes.URI_FILE :

input = Input(
    type=AssetTypes.URI_FILE,
    path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv"
)

Utilisez le corps de texte suivant dans votre requête :

{
   "properties": {
       "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
       }
   }
}

Si vos données se trouvent dans un fichier, remplacez la valeur JobInputType par UriFile :

{
   "properties": {
       "InputData": {
           "heart_data": {
               "JobInputType" : "UriFile",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv"
           }
       }
   }
}

Exécutez le point de terminaison :
Utilisez l’argument --set pour spécifier l’entrée :
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.heart_data.type="uri_folder" inputs.heart_data.path=$INPUT_DATA
```
Pour un point de terminaison qui sert un déploiement de modèle, vous pouvez utiliser l’argument --input pour spécifier l’entrée de données, car un modèle de déploiement nécessite toujours une seule entrée de données.
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --input $INPUT_DATA --input-type uri_folder
```
L’argument --set a tendance à produire de longues commandes lorsque vous spécifiez plusieurs entrées. Dans ce cas, vous pouvez répertorier vos entrées dans un fichier, puis faire référence au fichier lorsque vous appelez votre point de terminaison. Par exemple, vous pouvez créer un fichier YAML nommé inputs.yml qui contient les lignes suivantes :
```
inputs:
  heart_data:
    type: uri_folder
    path: https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data
```
Vous pouvez ensuite exécuter la commande suivante, qui utilise l’argument --file pour spécifier les entrées :
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml
```
Si vos données se trouvent dans un fichier, utilisez le type uri_file dans le fichier inputs.yml pour l’entrée de données.
Appelez la méthode invoke en utilisant le paramètre inputs pour spécifier les entrées requises :
```
job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": input
    }
)
```
Pour simplifier l’invokeappel au modèle de déploiement, utilisez le input paramètre pour spécifier l'emplacement des données d'entrée :
```
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input
)
```
Conseil

Quelle est la différence entre les paramètres inputs et input lorsque vous appelez un point de terminaison ?

En général, vous pouvez utiliser un paramètre inputs = {} de dictionnaire avec la méthode invoke pour fournir un nombre arbitraire d’entrées nécessaires à un point de terminaison de lot qui contient un déploiement de modèle ou un déploiement de pipeline.

Pour un déploiement de modèle, vous pouvez utiliser le paramètre input comme moyen plus court pour spécifier l’emplacement des données d’entrée pour le déploiement. Cette approche fonctionne car un déploiement de modèle ne prend toujours qu’une seule entrée de données.
Créez votre requête :
```
POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
```

Créer des tâches avec des entrées littérales

Les déploiements de composants de pipeline prennent en charge les entrées littérales. Pour obtenir un exemple de déploiement par lots qui contient un pipeline de base, consultez Guide pratique pour déployer des pipelines avec des points de terminaison de lot.

L’exemple suivant montre comment spécifier une entrée nommée score_mode, de type string, avec la valeur append :

Placez vos entrées dans un fichier YAML, tel qu’un fichier nommé inputs.yml :

inputs:
  score_mode:
    type: string
    default: append

Exécutez la commande suivante, qui utilise l’argument --file pour spécifier les entrées.

az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml

Vous pouvez également utiliser l'argument --set pour spécifier le type et la valeur par défaut. Mais cette approche tend à produire de longues commandes lorsque vous spécifiez plusieurs entrées :

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.score_mode.type="string" inputs.score_mode.default="append"

Utilisez le paramètre inputs pour fournir des informations sur l’entrée littérale.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name, 
    inputs = { 
        'score_mode': Input(type="string", default="append")
        }
)

Utilisez le corps de texte suivant dans votre requête :

{
    "properties": {
        "InputData": {
            "score_mode": {
                "JobInputType" : "Literal",
                "Value": "append"
            }
        }
    }
}

Créez votre requête :

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

Créer des tâches avec des sorties de données

L’exemple suivant montre comment modifier l’emplacement d’une sortie nommée score. À des fins d’exhaustivité, l’exemple configure également une entrée nommée heart_data.

Cet exemple utilise le magasin de données par défaut, workspaceblobstore. Mais vous pouvez utiliser n’importe quel autre magasin de données dans votre espace de travail, tant qu’il s’agit d’un compte Stockage Blob. Si vous souhaitez utiliser un autre magasin de données, remplacez workspaceblobstore dans les étapes suivantes le nom de votre magasin de données préféré.

Obtient l’ID du magasin de données.
```
DATA_STORE_ID=$(az ml datastore show -n workspaceblobstore | jq -r '.id')
```
```
from azure.ai.ml import Output

default_ds = ml_client.datastores.get_default()
```
Recherchez les valeurs suivantes, puis construisez l’ID de magasin de données :
- Identifiant d’abonnement
- Nom du groupe ressources
- Nom de l’espace de travail
L’ID de magasin de données a le format /subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/datastores/workspaceblobstore.

Créez une sortie de données :

Définissez les valeurs d’entrée et de sortie dans un fichier nommé inputs-and-outputs.yml. Utilisez l’ID du magasin de données dans le chemin de sortie. À des fins d’exhaustivité, définissez également l’entrée de données.

inputs:
  heart_data:
    type: uri_folder
    path: https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data
outputs:
  score:
    type: uri_file
    path: <data-store-ID>/paths/batch-jobs/my-unique-path

Définissez la variable de chemin d’accès output :

data_path = "batch-jobs/my-unique-path"
output = Output(type=AssetTypes.URI_FILE, path=f"{default_ds.id}/paths/{data_path}")

À des fins d’exhaustivité, créez également une entrée de données :

input = Input(
    type=AssetTypes.URI_FOLDER,
    path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
)

Utilisez le corps de texte suivant dans votre requête. Remplacez d'abord le <data-path> caractère générique par un chemin d'accès unique, tel que batch-jobs/my-unique-path. Remplacez également l'espace réservé <data-store-ID> par l'ID de votre magasin de données.

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        },
        "OutputData": {
            "score": {
                "JobOutputType" : "UriFile",
                "Uri": "<data-store-ID>/paths/<data-path>"
            }
        }
    }
}

Remarque

Notez que le dossier paths fait partie du chemin d’accès de sortie. Ce format indique que la valeur qui suit est un chemin d’accès.

Exécutez le déploiement :

Utilisez l'argument --file pour spécifier les valeurs d'entrée et de sortie :

az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs-and-outputs.yml

Utilisez le paramètre outputs pour fournir des informations sur la sortie.

job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   inputs={ "heart_data": input },
   outputs={ "score": output }
)

Créez votre requête :

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

Partage via

Créer des travaux et des données d’entrée pour les points de terminaison de lot

Prérequis

Établir l’authentification

Créer des travaux de base

Appeler un déploiement spécifique

Configurer les propriétés du travail

Configurer le nom de l’expérience

Présentation des entrées et des sorties

Explorer les entrées de données

Explorer les entrées littérales

Explorer les sorties de données

Créer des tâches avec des entrées de données

Utilisez la saisie de données à partir d’une ressource de données

Utilisez la saisie de données à partir d’un magasin de données

Utiliser des données d'entrée provenant d'un compte de stockage Azure

Créer des tâches avec des entrées littérales

Créer des tâches avec des sorties de données

Commentaires

Ressources supplémentaires

Partage via

Créer des travaux et des données d’entrée pour les points de terminaison de lot

Prérequis

Établir l’authentification

Créer des travaux de base

Appeler un déploiement spécifique

Configurer les propriétés du travail

Configurer le nom de l’expérience

Présentation des entrées et des sorties

Explorer les entrées de données

Explorer les entrées littérales

Explorer les sorties de données

Créer des tâches avec des entrées de données

Utilisez la saisie de données à partir d’une ressource de données

Utilisez la saisie de données à partir d’un magasin de données

Utiliser des données d'entrée provenant d'un compte de stockage Azure

Créer des tâches avec des entrées littérales

Créer des tâches avec des sorties de données

Contenu connexe

Commentaires

Ressources supplémentaires