バッチエンドポイントのジョブと入力データを作成する

[アーティクル]
02/04/2025

Azure Machine Learning でバッチエンドポイントを使用すると、大量の入力データに対して長いバッチ操作を実行できます。データは、異なるリージョン間など、さまざまな場所に配置できます。特定の種類のバッチエンドポイントでは、リテラルパラメーターを入力として受け取ることもできます。

この記事では、バッチエンドポイントのパラメーター入力を指定し、デプロイジョブを作成する方法について説明します。このプロセスでは、データ資産、データストア、ストレージアカウント、ローカルファイルなど、さまざまなソースからのデータの操作がサポートされています。

前提条件

バッチエンドポイントとデプロイ。これらのリソースを作成するには、「Azure Machine Learning にバッチデプロイで MLflow モデルをデプロイする」を参照してください。
バッチエンドポイントデプロイを実行するためのアクセス許可。 AzureML データ科学者、共同作成者、所有者の各ロールを使用して、デプロイを実行できます。カスタム役割の定義に必要な特定のアクセス許可を確認するには、「バッチエンドポイントでの認可」を参照してください。
エンドポイントを呼び出す資格情報。詳細については、「認証の確立」を参照してください。
エンドポイントがデプロイされているコンピューティングクラスターからの入力データに対する読み取りアクセス。

ヒント

特定の状況では、資格情報のないデータストアまたは外部の Azure Storage アカウントをデータ入力として使用する必要があります。これらのシナリオでは、コンピューティングクラスターのマネージド ID がストレージアカウントのマウントに使用されるため、データアクセス用にコンピューティングクラスターを構成してください。ジョブ (呼び出し元) の ID は基になるデータの読み取りに使用されるため、引き続ききめ細かいアクセスの制御が可能です。

認証を確立する

エンドポイントを呼び出すには、有効な Microsoft Entra トークンが必要です。エンドポイントを呼び出すと、Azure Machine Learning によって、トークンに関連付けられている ID の下にバッチデプロイジョブが作成されます。

Azure Machine Learning CLI (v2) または Azure Machine Learning SDK for Python (v2) を使用してエンドポイントを呼び出す場合、Microsoft Entra トークンを手動で取得する必要はありません。サインイン時に、システムによってユーザー ID が認証されます。また、トークンが取得されて渡されます。
REST API を使用してエンドポイントを呼び出す場合は、トークンを手動で取得する必要があります。

次の手順で説明するように、呼び出しには独自の資格情報を使用できます。

Azure CLI を使用して、対話型認証またはデバイスコード認証でサインインします。

az login

Azure Machine Learning SDK for Python を使ってサインインします。

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(DefaultAzureCredential())

構成が Azure Machine Learning コンピューティングインスタンスの外部で実行される場合は、エンドポイントがデプロイされているワークスペースを指定する必要があります。

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

subscription_id = "<subscription-ID>"
resource_group = "<resource-group-name>"
workspace = "<workspace-name>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

ユーザーアカウントの有効なトークンを取得する最も簡単な方法は、Azure CLI を使用することです。コンソールで、次の Azure CLI コマンドを実行します。

az account get-access-token --resource https://ml.azure.com --query "accessToken" --output tsv

ヒント

REST 要求を使用する場合は、サービスプリンシパルを使用してバッチエンドポイントを呼び出すことをお勧めします。詳細については、「サービスプリンシパルを使用してジョブを実行する」を参照してください。

さまざまな種類の資格情報の詳細については、「さまざまな種類の資格情報を使用してジョブを実行する方法」を参照してください。

基本的なジョブを作成する

バッチエンドポイントからジョブを作成するには、エンドポイントを呼び出します。呼び出しは、Azure Machine Learning CLI、Azure Machine Learning SDK for Python、または REST API 呼び出しを使用して実行できます。

次の例は、処理用の単一の入力データフォルダーを受け取るバッチエンドポイントの呼び出しの基本を示しています。さまざまな入力と出力を呼び出す例については、「入力と出力について」を参照してください。

バッチエンドポイントで invoke 操作を使用します。

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
                            --input https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data

バッチエンドポイントを呼び出すには、MLClient.batch_endpoints.invoke() メソッドを使用します。次のコードでは、endpoint はエンドポイントオブジェクトです。

from azure.ai.ml import Input

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": Input(path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data")
    }
)

エンドポイントの呼び出し URL に POST 要求を行います。呼び出し URL を取得するには、Azure Machine Learning スタジオに移動し、エンドポイントの詳細ページを開きます。

要求では次の本文を使います。

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        }
    }
}

要求を作成します。

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

特定のデプロイを呼び出す

バッチエンドポイントは、同じエンドポイントで複数のデプロイをホストできます。ユーザーが特に指定しない限り、既定のエンドポイントが使われます。次の手順を使用して、使用するデプロイを変更できます。

引数 --deployment-name または -d を使ってデプロイの名前を指定します。

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
                            --deployment-name $DEPLOYMENT_NAME \
                            --input https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data

パラメーター deployment_name を使ってデプロイの名前を指定します。次のコードでは、deployment はデプロイオブジェクトです。

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    deployment_name=deployment.name,
    inputs={
        "heart_data": Input(path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data")
    }
)

要求では次の本文を使います。

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        }
    }
}

ヘッダーキー azureml-model-deployment を要求に追加します。その値には、呼び出すデプロイの名前を使用します。

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
azureml-model-deployment: <deployment-name>

ジョブのプロパティを構成する

一部のジョブプロパティは、呼び出し時に構成できます。

Note

現時点では、パイプラインコンポーネントのデプロイを使用して、バッチエンドポイントでのみジョブのプロパティを構成できます。

実験名を構成する

実験名を構成するには、次の手順を使用します。

引数 --experiment-name を使って実験の名前を指定します。

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
                            --experiment-name "my-batch-job-experiment" \
                            --input https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data

パラメーター experiment_name を使って実験の名前を指定します。

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    experiment_name="my-batch-job-experiment",
    inputs={
        "heart_data": Input(path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"),
    }
)

本文の properties セクションで experimentName キーを使用して実験名を指定します。

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        },
        "properties":
        {
            "experimentName": "my-batch-job-experiment"
        }
    }
}

要求を作成します。

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

入力と出力について

バッチエンドポイントは、コンシューマーがバッチジョブの作成に使用できる永続的な API を提供します。同じインターフェイスを使用して、デプロイで想定される入力と出力を指定できます。入力を使用して、ジョブを実行するためにエンドポイントに必要な情報を渡します。

バッチエンドポイントで入力と出力がどのように使用されるかを示す図。

バッチエンドポイントは次の 2 種類の入力をサポートします。

データ入力。つまり、特定の保存場所または Azure Machine Learning 資産へのポインター
リテラル入力。つまり、ジョブに渡すリテラル値 (数値や文字列など)

入力と出力の数と種類は、バッチデプロイの種類によって異なります。モデルデプロイは、常に 1 つのデータ入力を必要とし、1 つのデータ出力を生成します。リテラル入力は、モデルデプロイではサポートされていません。これに対し、パイプラインコンポーネントデプロイでは、エンドポイントを構築するためのより一般的なコンストラクトが提供されます。パイプラインコンポーネントデプロイでは、任意の数のデータ入力、リテラル入力、出力を指定できます。

次の表は、バッチデプロイの入力と出力をまとめたものです。

デプロイの種類	入力の数	サポートされている入力の種類	出力の数	サポートされている出力の種類
モデルデプロイ	1	データ入力	1	データ出力
パイプラインコンポーネントデプロイ	0-N	データ入力とリテラル入力	0-N	データ出力

ヒント

入力と出力は常に名前付きです。それぞれの名前は、データを識別し、呼び出し中に値を渡すためのキーとして機能します。モデルデプロイでは、常に 1 つの入力と出力が必要であるため、モデルデプロイでの呼び出し中に名前は無視されます。 sales_estimation のように、ユースケースを最もよく表す名前を割り当てることができます。

データ入力を調べる

データ入力とは、データが配置されている場所を指す入力のことです。バッチエンドポイントは通常、大量のデータを消費するため、呼び出し要求の一部として入力データを渡すことはできません。代わりに、バッチエンドポイントがデータを検索する場所を指定します。パフォーマンスを向上させるために、入力データはターゲットコンピューティングインスタンスにマウントされ、ストリーミングされます。

バッチエンドポイントは、次の種類のストレージにあるファイルを読み取ることができます。

Azure Machine Learning データ資産。フォルダー (uri_folder)、ファイル (uri_file) の種類などです。
Azure Machine Learning データストア。Azure Blob Storage、Azure Data Lake Storage Gen1、Azure Data Lake Storage Gen2 などです。
Blob Storage、Data Lake Storage Gen1、Data Lake Storage Gen2 などの Azure Storage アカウント。
Azure Machine Learning CLI または Azure Machine Learning SDK for Python を使用してエンドポイントを呼び出す場合は、ローカルデータフォルダーとファイル。ただし、ローカルデータは、Azure Machine Learning ワークスペースの既定のデータストアにアップロードされます。

重要

非推奨の通知: 型 FileDataset (V1) のデータ資産は非推奨で、今後廃止される予定です。この機能に依存する既存のバッチエンドポイントは引き続き機能します。ただし、次を使用して作成されたバッチエンドポイント内の V1 データセットはサポートされません。

一般公開されている Azure Machine Learning CLI v2 のバージョン (2.4.0 以降)。
一般公開されている REST API のバージョン (2022-05-01 以降)。

リテラル入力を調べる

リテラル入力とは文字列、数値、ブール値など、呼び出し時に表現および解決できる入力のことです。通常は、リテラル入力を使用して、パイプラインコンポーネントデプロイの一部としてエンドポイントにパラメーターを渡します。バッチエンドポイントでは、次のリテラル型がサポートされています。

string
boolean
float
integer

リテラル入力は、パイプラインコンポーネントのデプロイでのみサポートされます。リテラルエンドポイントを指定する方法を確認するには、「リテラル入力を使ってジョブを作成する」を参照してください。

データ出力を調べる

データ出力とは、バッチジョブの結果が配置される場所のことです。各出力には識別可能な名前が付けられ、Azure Machine Learning によって、名前付き出力のそれぞれに一意のパスが自動的に割り当てられます。必要に応じて、別のパスを指定できます。

重要

バッチエンドポイントでは、Blob Storage データストアでの出力の書き込みのみがサポートされます。階層型名前空間が有効なストレージアカウント (Data Lake Storage Gen2 など) に書き込む必要がある場合、サービスは完全に互換性があるため、ストレージサービスを Blob Storage データストアとして登録できます。このように、バッチエンドポイントからの出力を Data Lake Storage Gen2 に書き込むことができます。

データ入力を使ってジョブを作成する

次の例は、データ資産、データストア、Azure Storage アカウントからデータ入力を取得するときにジョブを作成する方法を示しています。

データ資産からの入力データを使用する

Azure Machine Learning のデータ資産 (以前のデータセット) は、ジョブへの入力としてサポートされています。 Azure Machine Learning の登録済みデータ資産に保存されている入力データを使用する、バッチエンドポイントジョブを実行するには、次の手順に従います。

警告

型 Table (MLTable) のデータ資産は、現在サポートされていません。

データ資産を作成します。この例では、複数の CSV ファイルを含むフォルダーで構成されています。バッチエンドポイントを使用して、ファイルを並列で処理します。データが既にデータ資産として登録されている場合は、この手順をスキップできます。
1. heart-data.yml という名前の YAML ファイルにデータ資産定義を作成します。
```
$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: heart-data
description: An unlabeled data asset for heart classification.
type: uri_folder
path: data
```
2. データ資産を作成します。
```
az ml data create -f heart-data.yml
```
1. データ資産定義を作成します。
```
from azure.ai.ml.constants import AssetTypes
from azure.ai.ml.entities import Data

data_path = "heart-classifier-mlflow/data"
data_asset_name = "heart-data"

heart_data_object = Data(
    path=data_path,
    type=AssetTypes.URI_FOLDER,
    description="An unlabeled data asset for heart classification",
    name=data_asset_name
)
```
2. データ資産を作成します。
```
ml_client.data.create_or_update(heart_data_object)
```
  新しく作成されたデータ資産を取得するには、次のコマンドを使用します。
```
heart_data_asset = ml_client.data.get(name=data_asset_name, label="latest")
```
Azure Machine Learning CLI または Azure Machine Learning SDK for Python を使用して、データ資産を作成します。
入力を設定します。
```
DATA_ASSET_ID=$(az ml data show -n heart-data --label latest | jq -r .id)
```
```
input = Input(path=heart_data_asset.id)
```
次の値を検索してから、データ資産 ID を作成します。
- サブスクリプション ID
- リソースグループ名
- ワークスペース名
- データ資産の名前
- データ資産のバージョン
データ資産 ID は /subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/data/<data-asset-name>/versions/<data-asset-version> 形式です。
エンドポイントを実行します。
--set 引数を使用して入力を指定します。最初に、データ資産の名前のハイフンをアンダースコア文字に置き換えます。キーに使用できるのは、英数字とアンダースコア文字だけです。
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.heart_data.type="uri_folder" inputs.heart_data.path=$DATA_ASSET_ID
```
モデルデプロイにサービスを提供するエンドポイントの場合、--input 引数を使用してデータ入力を指定できます。これは、モデルデプロイで必要なデータ入力が常に 1 つだけであるためです。
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --input $DATA_ASSET_ID
```
複数の入力を指定する場合、引数 --set によって長いコマンドが生成される傾向があります。このような場合は、ファイル内の入力を一覧表示し、エンドポイントを呼び出すときにファイルを参照できます。たとえば、次の行を含む inputs.yml という名前の YAML ファイルを作成できます。
```
inputs:
  heart_data:
    type: uri_folder
    path: /subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/data/heart-data/versions/1
```
次に、--file 引数を使用して入力を指定する次のコマンドを実行できます。
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml
```
invoke メソッドを呼び出し、inputs パラメーターを使用して必要な入力を指定します。
```
job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": input
    }
)
```
モデルデプロイの invoke 呼び出しを効率化するには、input パラメーターを使用して入力データの場所を指定します。
```
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input
)
```
ヒント

エンドポイントを呼び出すときのパラメーター inputs と input の違いは何ですか?

一般的には invoke メソッドで辞書パラメーター inputs = {} を使用すると、"モデルデプロイ" または "パイプラインデプロイ" を含むバッチエンドポイントに任意の個数の必須入力を与えることができます。

"モデルデプロイ" の場合は、デプロイの入力データの場所を指定する簡単な方法として input パラメーターを使用できます。このアプローチが機能するのは、モデルデプロイが常に 1 つだけのデータ入力を受け取るためです。
要求では次の本文を使います。
```
{
    "properties": {
        "InputData": {
            "heart_data": {
                "JobInputType" : "UriFolder",
                "Uri": "<data-asset-ID>"
            }
        }
    }
}
```
要求を作成します。
```
POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
```

データストアからの入力データを使用する

バッチデプロイジョブは、Azure Machine Learning に登録済みのデータストア内のデータを直接参照できます。この例では、まず、Azure Machine Learning ワークスペース内のデータストアにいくつかのデータをアップロードします。その後、そのデータに対してバッチデプロイを実行します。

この例では、既定のデータストアを使用しますが、別のデータストアを使用できます。 Azure Machine Learning ワークスペースでは、既定の BLOB データストアの名前は workspaceblobstore です。次の手順で別のデータストアを使用する場合は、workspaceblobstore を優先するデータストアの名前に置き換えます。

サンプルデータをデータストアにアップロードします。サンプルデータは、azureml-examples リポジトリで入手できます。データは、そのリポジトリの sdk/python/endpoints/batch/deploy-models/heart-classifier-mlflow/data フォルダーにあります。
1. Azure Machine Learning スタジオで、既定の BLOB データストアのデータ資産ページを開き、その BLOB コンテナーの名前を検索します。
2. Azure Storage Explorer や AzCopy などのツールを使用して、そのコンテナー内の heart-disease-uci-unlabeled という名前のフォルダーにサンプルデータをアップロードします。
入力情報を設定します。
ファイルパスを INPUT_PATH 変数に配置します。
```
DATA_PATH="heart-disease-uci-unlabeled"
INPUT_PATH="azureml://datastores/workspaceblobstore/paths/$DATA_PATH"
```
ファイルパスを input 変数に配置します。
```
data_path = "heart-disease-uci-unlabeled"
input = Input(type=AssetTypes.URI_FOLDER, path=f"azureml://datastores/workspaceblobstore/paths/{data_path}")
```
データがファイル内にある場合は、入力の種類の割り当てを type=AssetTypes.URI_FILE に変更します。
要求では次の本文を使います。最初に、プレースホルダーを適切な値に置き換えます。 <data-path> プレースホルダーを heart-disease-uci-unlabeled に置き換えます。
```
{
    "properties": {
        "InputData": {
            "heart_data": {
                "JobInputType" : "UriFolder",
                "Uri": "/subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/datastores/workspaceblobstore/paths/<data-path>"
            }
        }
    }
}
```
データがファイル内にある場合は、JobInputType 値に UriFile 型を使用します。
paths フォルダーが入力パスの一部であることがわかります。この形式は、後続の値がパスであることを示します。
エンドポイントを実行します。
--set 引数を使用して入力を指定します。
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.heart_data.type="uri_folder" inputs.heart_data.path=$INPUT_PATH
```
モデルデプロイにサービスを提供するエンドポイントの場合、--input 引数を使用してデータ入力を指定できます。これは、モデルデプロイで必要なデータ入力が常に 1 つだけであるためです。
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --input $INPUT_PATH --input-type uri_folder
```
複数の入力を指定する場合、引数 --set によって長いコマンドが生成される傾向があります。このような場合は、ファイル内の入力を一覧表示し、エンドポイントを呼び出すときにファイルを参照できます。たとえば、次の行を含む inputs.yml という名前の YAML ファイルを作成できます。
```
inputs:
  heart_data:
    type: uri_folder
    path: azureml://datastores/workspaceblobstore/paths/<data-path>
```
データがファイル内にある場合は、代わりに入力に uri_file 型を使用します。

次に、--file 引数を使用して入力を指定する次のコマンドを実行できます。
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml
```
inputs パラメーターを使用して invoke メソッドを呼び出し、必要な入力を指定します。
```
job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": input
    }
)
```
モデルデプロイの invoke 呼び出しを効率化するには、input パラメーターを使用して入力データの場所を指定します。
```
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input
)
```
ヒント

エンドポイントを呼び出すときのパラメーター inputs と input の違いは何ですか?

一般的には invoke メソッドで辞書パラメーター inputs = {} を使用すると、"モデルデプロイ" または "パイプラインデプロイ" を含むバッチエンドポイントに任意の個数の必須入力を与えることができます。

"モデルデプロイ" の場合は、デプロイの入力データの場所を指定する簡単な方法として input パラメーターを使用できます。このアプローチが機能するのは、モデルデプロイが常に 1 つだけのデータ入力を受け取るためです。
要求を作成します。
```
POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
```

Azure Storage アカウントからの入力データを使用する

Azure Machine Learning バッチエンドポイントでは、Azure Storage アカウント内のクラウドの場所 (パブリックとプライベートの両方) からデータを読み取ることができます。ストレージアカウント内のデータを使用してバッチエンドポイントジョブを実行するには、次の手順を使用します。

ストレージアカウントからデータを読み取るために必要な追加の構成の詳細については、「データアクセス用にコンピューティングクラスターを構成する」を参照してください。

入力を設定します。

INPUT_DATA 変数を設定します。

INPUT_DATA="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"

データがファイル内にある場合は、次のような形式を使用して入力パスを定義します。

INPUT_DATA="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv"

input 変数を設定します。

input = Input(
    type=AssetTypes.URI_FOLDER, 
    path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
)

データがファイル内にある場合は、入力の種類の割り当てを type=AssetTypes.URI_FILE に変更します。

input = Input(
    type=AssetTypes.URI_FILE,
    path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv"
)

要求では次の本文を使います。

{
   "properties": {
       "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
       }
   }
}

データがファイル内にある場合は、JobInputType の値を UriFile に変更します。

{
   "properties": {
       "InputData": {
           "heart_data": {
               "JobInputType" : "UriFile",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv"
           }
       }
   }
}

エンドポイントを実行します。
--set 引数を使用して入力を指定します。
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.heart_data.type="uri_folder" inputs.heart_data.path=$INPUT_DATA
```
モデルデプロイにサービスを提供するエンドポイントの場合、--input 引数を使用してデータ入力を指定できます。これは、モデルデプロイで必要なデータ入力が常に 1 つだけであるためです。
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --input $INPUT_DATA --input-type uri_folder
```
複数の入力を指定する場合、--set 引数によって長いコマンドが生成される傾向があります。このような場合は、ファイル内の入力を一覧表示し、エンドポイントを呼び出すときにファイルを参照できます。たとえば、次の行を含む inputs.yml という名前の YAML ファイルを作成できます。
```
inputs:
  heart_data:
    type: uri_folder
    path: https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data
```
次に、--file 引数を使用して入力を指定する次のコマンドを実行できます。
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml
```
データがファイル内にある場合は、データ入力に inputs.yml ファイルの uri_file 型を使用します。
inputs パラメーターを使用して invoke メソッドを呼び出し、必要な入力を指定します。
```
job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": input
    }
)
```
モデルデプロイの invoke 呼び出しを効率化するには、input パラメーターを使用して入力データの場所を指定します。
```
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input
)
```
ヒント

エンドポイントを呼び出すときのパラメーター inputs と input の違いは何ですか?

一般的には invoke メソッドで辞書パラメーター inputs = {} を使用すると、"モデルデプロイ" または "パイプラインデプロイ" を含むバッチエンドポイントに任意の個数の必須入力を与えることができます。

"モデルデプロイ" の場合は、デプロイの入力データの場所を指定する簡単な方法として input パラメーターを使用できます。このアプローチが機能するのは、モデルデプロイが常に 1 つだけのデータ入力を受け取るためです。
要求を作成します。
```
POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
```

リテラル入力を使ってジョブを作成する

パイプラインコンポーネントのデプロイでは、リテラル入力を受け取ることができます。基本的なパイプラインを含むバッチデプロイの例については、「バッチエンドポイントを使用してパイプラインをデプロイする方法」を参照してください。

次の例は、名前が score_mode、型が string、値が append の入力を指定する方法を示します。

inputs.yml という名前のような YAML ファイルに入力を配置します。

inputs:
  score_mode:
    type: string
    default: append

--file 引数を使用して入力を指定する次のコマンドを実行します。

az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml

--set 引数を使用して、型と既定値を指定することもできます。ただし、この方法では、複数の入力を指定すると、長いコマンドが生成される傾向があります。

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.score_mode.type="string" inputs.score_mode.default="append"

リテラル入力に関する情報を指定するには、inputs パラメーターを使用します。

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name, 
    inputs = { 
        'score_mode': Input(type="string", default="append")
        }
)

要求では次の本文を使います。

{
    "properties": {
        "InputData": {
            "score_mode": {
                "JobInputType" : "Literal",
                "Value": "append"
            }
        }
    }
}

要求を作成します。

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

データ出力を使ってジョブを作成する

次の例は、score という名前の出力の場所を変更する方法を示しています。完全にするために、この例では heart_data という名前の入力も構成します。

この例では、既定のデータストア workspaceblobstore を使用します。ただし、Blob Storage アカウントであれば、ワークスペース内の他の任意のデータストアを使用できます。別のデータストアを使用する場合は、次の手順の workspaceblobstore を優先するデータストアの名前に置き換えます。

データストアの ID を取得します。
```
DATA_STORE_ID=$(az ml datastore show -n workspaceblobstore | jq -r '.id')
```
```
from azure.ai.ml import Output

default_ds = ml_client.datastores.get_default()
```
次の値を検索してから、データストア ID を作成します。
- サブスクリプション ID
- リソースグループ名
- ワークスペース名
データストア ID は /subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/datastores/workspaceblobstore 形式です。

データ出力を作成します。

inputs-and-outputs.yml という名前のファイルで入力と出力の値を定義します。出力パスでデータストア ID を使用します。完全にするために、データ入力も定義します。

inputs:
  heart_data:
    type: uri_folder
    path: https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data
outputs:
  score:
    type: uri_file
    path: <data-store-ID>/paths/batch-jobs/my-unique-path

output パス変数を設定します。

data_path = "batch-jobs/my-unique-path"
output = Output(type=AssetTypes.URI_FILE, path=f"{default_ds.id}/paths/{data_path}")

完全にするために、データ入力も作成します。

input = Input(
    type=AssetTypes.URI_FOLDER,
    path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
)

要求では次の本文を使います。まず、<data-path> プレースホルダーを、batch-jobs/my-unique-path などの一意のパスに置き換えます。また、<data-store-ID> プレースホルダーをデータストアの ID に置き換えます。

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        },
        "OutputData": {
            "score": {
                "JobOutputType" : "UriFile",
                "Uri": "<data-store-ID>/paths/<data-path>"
            }
        }
    }
}

Note

paths フォルダーが出力パスの一部であることがわかります。この形式は、後続の値がパスであることを示します。

デプロイを実行します。

--file 引数を使用して、入力と出力の値を指定します。

az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs-and-outputs.yml

outputs パラメーターを使用して、出力に関する情報を指定します。

job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   inputs={ "heart_data": input },
   outputs={ "score": output }
)

要求を作成します。

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

次の方法で共有

バッチエンドポイントのジョブと入力データを作成する

前提条件

認証を確立する

基本的なジョブを作成する

特定のデプロイを呼び出す

ジョブのプロパティを構成する

実験名を構成する

入力と出力について

データ入力を調べる

リテラル入力を調べる

データ出力を調べる

データ入力を使ってジョブを作成する

データ資産からの入力データを使用する

データストアからの入力データを使用する

Azure Storage アカウントからの入力データを使用する

リテラル入力を使ってジョブを作成する

データ出力を使ってジョブを作成する

フィードバック

その他のリソース

次の方法で共有

バッチ エンドポイントのジョブと入力データを作成する

前提条件

認証を確立する

基本的なジョブを作成する

特定のデプロイを呼び出す

ジョブのプロパティを構成する

実験名を構成する

入力と出力について

データ入力を調べる

リテラル入力を調べる

データ出力を調べる

データ入力を使ってジョブを作成する

データ資産からの入力データを使用する

データ ストアからの入力データを使用する

Azure Storage アカウントからの入力データを使用する

リテラル入力を使ってジョブを作成する

データ出力を使ってジョブを作成する

関連するコンテンツ

フィードバック

その他のリソース

バッチエンドポイントのジョブと入力データを作成する

データストアからの入力データを使用する