共用方式為


AutoMLStep 類別

建立 Azure ML 管線步驟,以封裝自動化 ML 執行。

如需使用 AutoMLStep 的範例,請參閱筆記本 https://aka.ms/pl-automl

初始化 AutoMLStep。

繼承
AutoMLStep

建構函式

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

參數

名稱 Description
name
必要
str

步驟的名稱。

automl_config
必要

AutoMLConfig 物件,定義此 AutoML 執行的組態。

inputs

輸入埠系結的清單。

預設值: None
outputs

輸出埠系結的清單。

預設值: None
script_repl_params

要在腳本中取代的選擇性參數,例如 {'param1': 'value1', 'param2': 'value2'}。

預設值: None
allow_reuse

指出當使用相同的設定重新執行時,步驟是否應該重複使用先前的結果。

預設會啟用重複使用。 如果步驟內容 (腳本/相依性) ,以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,則會立即讓任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集做為輸入,則重複使用取決於資料集的定義是否已變更,而非基礎資料是否已變更。

預設值: True
version
str

要指派給步驟的版本。

預設值: None
hash_paths

已淘汰。 檢查管線步驟內容的變更時,雜湊的路徑清單。

根據預設,中 AutoMLConfig 參數下 path 的所有檔案都會雜湊,但 底下的 path .amlignore 或 .gitignore 所列的檔案除外。 如果沒有偵測到任何變更,管線會重複使用先前執行中的步驟內容。

預設值: None
enable_default_model_output

指出是否要將最佳模型新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取最佳模型。 請注意,如果不需要預設模型輸出,建議將此參數設定為 False

預設值: True
enable_default_metrics_output

指出是否所有子執行計量都會新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取子執行計量。 請注意,如果不需要預設計量輸出,建議將此參數設定為 False

預設值: True
name
必要
str

步驟的名稱。

automl_config
必要

定義此 AutoML 執行的組態的 AutoMLConfig。

inputs
必要

輸入埠系結的清單。

outputs
必要

輸出埠系結的清單。

script_repl_params
必要

要在腳本中取代的選擇性參數,例如 {'param1': 'value1', 'param2': 'value2'}。

script_repl_params
必要

要在腳本中取代的選擇性參數。

allow_reuse
必要

指出當使用相同的設定重新執行時,步驟是否應該重複使用先前的結果。

預設會啟用重複使用。 如果步驟內容 (腳本/相依性) ,以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,則會立即讓任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集做為輸入,則重複使用取決於資料集的定義是否已變更,而非基礎資料是否已變更。

version
必要
str

要指派給步驟的版本。

hash_paths
必要

已淘汰。 檢查管線步驟內容的變更時,雜湊的路徑清單。

根據預設,中 AutoMLConfig 參數下 path 的所有檔案都會雜湊,但 底下的 path .amlignore 或 .gitignore 所列的檔案除外。 如果沒有偵測到任何變更,管線會重複使用先前執行中的步驟內容。

enable_default_model_output
必要

指出是否要將最佳模型新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取最佳模型。 請注意,如果不需要預設模型輸出,建議將此參數設定為 False

enable_default_metrics_output
必要

指出是否所有子執行計量都會新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取子執行計量。 請注意,如果不需要預設計量輸出,建議將此參數設定為 False

備註

透過 AutoMLStep 類別,您可以在 Azure Machine Learning 管線中執行自動化 ML 工作流程。 管線提供優點,例如可重複性、自動執行、版本設定和追蹤,以及自動化 ML 工作流程的模組化。 如需詳細資訊,請參閱 什麼是 Azure Machine Learning 管線?

當您的自動化 ML 工作流程在管線中時,您可以排程管線以時間為基礎的排程或變更型排程執行。 時間型排程對於監視資料漂移等例行工作很有用,而變更型排程對於不規則或無法預測的變更很有用,例如資料變更時。 例如,您的排程可能會輪詢正在上傳資料的 Blob 存放區,然後在資料變更時再次執行管線,然後在執行完成後註冊新版本的模型。 如需詳細資訊,請參閱 排程機器學習管線從邏輯應用程式觸發機器學習管線的執行

下列範例示範如何建立 AutoMLStep。


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

完整範例可從 https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

下列範例示範如何在 中使用 Pipeline AutoMLStep 物件。


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

完整範例可從 https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

上述範例顯示管線中的一個步驟。 不過,在真實世界自動化 ML 工作流程中使用 AutoMLStep 時,您至少有一個管線步驟會在 AutoMLStep 之前執行資料準備,並在該步驟之後執行另一個管線步驟來註冊模型。 如需這類工作流程的範例,請參閱筆記本 https://aka.ms/automl-retrain-pipeline

若要管理、檢查狀態,以及從管線執行取得執行詳細資料,請使用 類別 AutoMLStepRun

如需 Azure 中自動化機器學習的詳細資訊,請參閱 什麼是自動化機器學習?一文。 如需在沒有使用管線的情況下設定自動化 ML 實驗的詳細資訊,請參閱 在 Python 中設定自動化 ML 實驗一文。

方法

create_node

從這個 AutoML 步驟建立節點,並將 新增至指定的圖形。

這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。

create_node

從這個 AutoML 步驟建立節點,並將 新增至指定的圖形。

這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。

create_node(graph, default_datastore, context)

參數

名稱 Description
graph
必要

要加入節點的繪圖物件。

default_datastore
必要

預設資料存放區。

context
必要
<xref:azureml.pipeline.core._GraphContext>

圖形內容。

傳回

類型 Description

已建立的節點。

屬性

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'