次の方法で共有


steps パッケージ

Azure Machine Learning のパイプラインで実行できる構築済みのステップが含まれています。

Azure ML のパイプラインの複数のステップを組み合わせて構成して、共有可能で再利用可能な Azure Machine Learning ワークフローであるパイプラインを構築できます。 パイプラインの各ステップは、ステップの内容 (スクリプトと依存関係) に加えて入力とパラメーターが変更されていない場合に、以前の実行結果を再利用できるように構成することができます。

このパッケージ内のクラスは、通常、core パッケージ内のクラスと共に使用されます。 コア パッケージには、データの構成 (PipelineData)、スケジュール (Schedule)、およびステップの出力の管理 (StepRun) を行うためのクラスが含まれています。

このパッケージ内の事前構成済みのステップは、機械学習ワークフローで発生する多くの一般的なシナリオに対応しています。 事前構築済みのパイプラインのステップを開始するには、以下を参照してください。

モジュール

adla_step

Azure Data Lake Analytics で U-SQL スクリプトを実行するための Azure ML パイプライン ステップを作成する機能が含まれています。

automl_step

Azure Machine Learning 内で自動 ML パイプライン ステップを追加および管理するための機能が含まれています。

azurebatch_step

Azure Batch で Windows 実行可能ファイルを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

command_step

コマンドを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

data_transfer_step

ストレージ オプション間でデータを転送する Azure ML パイプライン ステップを作成する機能が含まれています。

databricks_step

DBFS で Databricks ノートブックまたは Python スクリプトを実行するための Azure ML パイプライン ステップを作成する機能が含まれています。

estimator_step

機械学習モデル トレーニングの推定器を実行するパイプライン ステップを作成する機能が含まれます。

hyper_drive_step

ハイパーパラメーターのチューニングを実行する Azure ML パイプライン ステップを作成および管理するための機能が含まれています。

kusto_step

Kusto ノートブックを実行する Azure ML パイプラインのステップを作成する機能が含まれています。

module_step

既存のバージョンのモジュールを使用して Azure Machine Learning パイプライン ステップを追加する機能が含まれています。

mpi_step

Machine Learning モデル トレーニング用の MPI ジョブを実行するための Azure ML パイプライン ステップを追加する機能が含まれています。

parallel_run_config

ParallelRunStep を構成するための機能が含まれています。

parallel_run_step

複数の AmlCompute ターゲットに対してユーザー スクリプトを並列モードで実行するためのステップを追加する機能が含まれています。

python_script_step

Python スクリプトを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

r_script_step

R スクリプトを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

synapse_spark_step

Python スクリプトを実行する Azure ML Synapse ステップを作成する機能が含まれています。

クラス

AdlaStep

Azure Data Lake Analytics で U-SQL スクリプトを実行するための Azure ML パイプライン ステップを作成します。

この AdlaStep の使用例については、ノートブック https://aka.ms/pl-adla を参照してください。

Azure Data Lake Analyticsを使用して U-SQL スクリプトを実行する Azure ML パイプライン ステップを作成します。

AutoMLStep

自動 ML 実行をカプセル化する Azure ML パイプライン ステップを作成します。

AutoMLStep の使用例については、ノートブック https://aka.ms/pl-automl を参照してください。

AutoMLStep を初期化します。

AutoMLStepRun

自動 ML 実験の実行および既定の出力を取得するためのメソッドに関する情報を提供します。

AutoMLStepRun クラスは、自動 ML 実行がパイプラインで送信された後に、実行の詳細の管理、ステータス チェック、取得を行うために使用されます。 さらに、このクラスを使用して、StepRun クラスを介して AutoMLStep の既定の出力を取得できます。

automl ステップ実行を初期化します。

AzureBatchStep

Azure Batch にジョブを送信するための Azure ML パイプライン ステップを作成します。

注: この手順は、ディレクトリとその内容のアップロード/ダウンロードには対応していません。

AzureBatchStep の使用例については、ノートブック https://aka.ms/pl-azbatch を参照してください。

Azure Batchにジョブを送信するための Azure ML パイプライン ステップを作成します。

CommandStep

コマンドを実行する Azure ML パイプライン ステップを作成します。

コマンドを実行する Azure ML パイプライン ステップを作成します。

DataTransferStep

ストレージ オプション間でデータを転送する Azure ML パイプライン ステップを作成します。

DataTransferStep は、Azure Blob Storage や Azure Data Lake などの一般的なストレージの種類をソースおよびシンクとしてサポートします。 詳細については、「注釈」セクションを参照してください。

DataTransferStep の使用例については、ノートブック https://aka.ms/pl-data-trans を参照してください。

ストレージ オプション間でデータを転送する Azure ML パイプライン ステップを作成します。

DatabricksStep

DataBricks ノートブック、Python スクリプト、または JAR をノードとして追加するための Azure ML パイプライン ステップが作成されます。

DatabricksStep の使用例については、ノートブック https://aka.ms/pl-databricks を参照してください。

DataBricks ノートブック、Python スクリプト、または JAR をノードとして追加する Azure ML パイプライン ステップを作成します。

DatabricksStep の使用例については、ノートブック https://aka.ms/pl-databricks を参照してください。

:p aram python_script_name:[必須] に関連 source_directoryする Python スクリプトの名前。 スクリプトが入力と出力を受け取る場合、それらがパラメーターとしてスクリプトに渡されます。 python_script_name が指定されている場合は、source_directory も必要です。

notebook_pathpython_script_pathpython_script_name、または main_class_name のいずれか 1 つのみを指定します。

DataReference オブジェクトを data_reference_name=input1 の入力として指定し、PipelineData オブジェクトを name=output1 の出力として指定した場合、入力と出力はパラメーターとしてスクリプトに渡されます。 これは次のようになります。各入力と出力のパスにアクセスするには、スクリプト内の引数を解析する必要があります: "-input1","wasbs://test@storagename.blob.core.windows.net/test","-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

さらに、スクリプト内で次のパラメーターを使用できます。

  • AZUREML_RUN_TOKEN: Azure Machine Learning を使用して認証を行うための AML トークン。
  • AZUREML_RUN_TOKEN_EXPIRY: AML トークンの有効期限。
  • AZUREML_RUN_ID: この実行の Azure Machine Learning 実行 ID。
  • AZUREML_ARM_SUBSCRIPTION: AML ワークスペースの Azure サブスクリプション。
  • AZUREML_ARM_RESOURCEGROUP: Azure Machine Learning ワークスペースの Azure リソース グループ。
  • AZUREML_ARM_WORKSPACE_NAME: Azure Machine Learning ワークスペースの名前。
  • AZUREML_ARM_PROJECT_NAME: Azure Machine Learning の実験の名前。
  • AZUREML_SERVICE_ENDPOINT: AML サービスのエンドポイント URL。
  • AZUREML_WORKSPACE_ID: Azure Machine Learning ワークスペースの ID。
  • AZUREML_EXPERIMENT_ID: Azure Machine Learning の実験の ID。
  • AZUREML_SCRIPT_DIRECTORY_NAME: source_directory がコピーされている DBFS のディレクトリ パス。
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

DatabricksStep パラメーター source_directorypython_script_name を使用して Databricks 上のローカル コンピューターから Python スクリプトを実行すると、source_directory が DBFS にコピーされ、DBFS 上のディレクトリ パスが実行の開始時にパラメーターとしてスクリプトに渡されます。 このパラメーターには、–AZUREML_SCRIPT_DIRECTORY_NAME というラベルが付けられます。 DBFS 内のディレクトリにアクセスするには、先頭に "dbfs:/" または "/dbfs/" という文字列を付ける必要があります。

EstimatorStep

非推奨。 Azure ML モデル トレーニング用に Estimator を実行するパイプライン ステップを作成します。

Azure ML Pipeline ステップを作成して、Estimator for Machine Learning モデルトレーニングを実行します。

非推奨。 代わりに CommandStep を使用してください。 例については、「CommandStep を使用してパイプラインで ML トレーニングを実行する方法」を参照してください。

HyperDriveStep

Azure ML パイプライン ステップを作成して、Machine Learning モデル トレーニングのためのハイパーパラメーター チューニングを実行します。

HyperDriveStep の使用例については、ノートブック https://aka.ms/pl-hyperdrive を参照してください。

Azure ML Pipeline ステップを作成して、Machine Learning モデル トレーニング用のハイパーパラメーター チューニングを実行します。

HyperDriveStepRun

HyperDriveStep のパイプライン ステップの実行の詳細を管理、状態確認、取得します。

HyperDriveStepRun は、HyperDriveRun の機能と、StepRun の追加サポートを提供します。 HyperDriveStepRun クラスでは、HyperDrive の実行とその生成された各子実行の実行の詳細を管理、確認、および取得できます。 StepRun クラスでは、親パイプラインの実行が送信され、そのパイプラインがステップ実行を送信したら、これを実行できます。

HyperDriveStepRun を初期化します。

HyperDriveStepRun は、HyperDriveRun の機能と、StepRun の追加サポートを提供します。 HyperDriveRun クラスを使用すると、HyperDrive の実行とその生成された各子実行の実行の詳細を管理、チェック、取得できます。 StepRun クラスでは、親パイプラインの実行が送信され、そのパイプラインがステップ実行を送信したら、これを実行できます。

KustoStep

KustoStep を使用すると、Azure ML Pipelines においてターゲットの Kusto クラスターで Kusto クエリを実行できます。

KustoStep を初期化します。

ModuleStep

特定のバージョンのモジュールを実行する Azure Machine Learning パイプライン ステップを作成します。

Module オブジェクトは、スクリプトや実行可能ファイルなどの再利用可能な評価を定義し、これはさまざまな機械学習シナリオで使用したり、さまざまなユーザーが使用したりできます。 パイプラインで特定のバージョンのモジュールを使用するには、ModuleStep を作成します。 ModuleStep は、既存の ModuleVersion を使用するパイプライン内のステップです。

ModuleStep の使用例については、ノートブック https://aka.ms/pl-modulestep を参照してください。

モジュールの特定のバージョンを実行する Azure ML パイプライン ステップを作成します。

MpiStep

MPI ジョブを実行する Azure ML パイプライン ステップを作成します。

MpiStep の使用例については、ノートブック https://aka.ms/pl-style-trans を参照してください。

MPI ジョブを実行する Azure ML パイプライン ステップを作成します。

非推奨。 代わりに CommandStep を使用してください。 例については、「 CommandStep を使用してパイプラインで分散トレーニングを実行する方法」を参照してください。

ParallelRunConfig

ParallelRunStep オブジェクトの構成を定義します。

ParallelRunStep の使用例については、ノートブック https://aka.ms/batch-inference-notebooks を参照してください。

トラブルシューティング ガイドについては、https://aka.ms/prstsg を参照してください。 その他の参照情報を見つけることができます。

config オブジェクトを初期化します。

ParallelRunStep

Azure Machine Learning パイプライン ステップを作成して、大量のデータを非同期かつ並列に処理します。

ParallelRunStep の使用例については、ノートブック https://aka.ms/batch-inference-notebooks を参照してください。

トラブルシューティング ガイドについては、https://aka.ms/prstsg を参照してください。 その他の参照情報を見つけることができます。

大量のデータを非同期的かつ並列に処理する Azure ML パイプライン ステップを作成します。

ParallelRunStep の使用例については、ノートブック リンク https://aka.ms/batch-inference-notebooksを参照してください。

PythonScriptStep

Python スクリプトを実行する Azure ML パイプライン ステップを作成します。

PythonScriptStep の使用例については、ノートブック https://aka.ms/pl-get-started を参照してください。

Python スクリプトを実行する Azure ML パイプライン ステップを作成します。

RScriptStep

Note

これは試験段階のクラスであり、いつでも変更される可能性があります。 詳細については、https://aka.ms/azuremlexperimental を参照してください。

R スクリプトを実行する Azure ML パイプライン ステップを作成します。

R スクリプトを実行する Azure ML パイプライン ステップを作成します。

非推奨。 代わりに CommandStep を使用してください。 例については、CommandStep を使用してパイプラインで R スクリプトを実行する方法に関するページを参照してください。

SynapseSparkStep

Note

これは試験段階のクラスであり、いつでも変更される可能性があります。 詳細については、https://aka.ms/azuremlexperimental を参照してください。

Python スクリプトを送信して実行する Azure ML Synapse のステップを作成します。

synapse Spark プールで Spark ジョブを実行する Azure ML パイプライン ステップを作成します。