AutoMLStep 類別
建立 Azure ML 管線步驟,以封裝自動化 ML 執行。
如需使用 AutoMLStep 的範例,請參閱筆記本 https://aka.ms/pl-automl 。
初始化 AutoMLStep。
- 繼承
-
AutoMLStep
建構函式
AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)
參數
名稱 | Description |
---|---|
name
必要
|
步驟的名稱。 |
automl_config
必要
|
AutoMLConfig 物件,定義此 AutoML 執行的組態。 |
inputs
|
輸入埠系結的清單。 預設值: None
|
outputs
|
輸出埠系結的清單。 預設值: None
|
script_repl_params
|
要在腳本中取代的選擇性參數,例如 {'param1': 'value1', 'param2': 'value2'}。 預設值: None
|
allow_reuse
|
指出當使用相同的設定重新執行時,步驟是否應該重複使用先前的結果。 預設會啟用重複使用。 如果步驟內容 (腳本/相依性) ,以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,則會立即讓任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集做為輸入,則重複使用取決於資料集的定義是否已變更,而非基礎資料是否已變更。 預設值: True
|
version
|
要指派給步驟的版本。 預設值: None
|
hash_paths
|
已淘汰。 檢查管線步驟內容的變更時,雜湊的路徑清單。 根據預設,中 AutoMLConfig 參數下 預設值: None
|
enable_default_model_output
|
指出是否要將最佳模型新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取最佳模型。
請注意,如果不需要預設模型輸出,建議將此參數設定為 預設值: True
|
enable_default_metrics_output
|
指出是否所有子執行計量都會新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取子執行計量。
請注意,如果不需要預設計量輸出,建議將此參數設定為 預設值: True
|
name
必要
|
步驟的名稱。 |
automl_config
必要
|
定義此 AutoML 執行的組態的 AutoMLConfig。 |
inputs
必要
|
輸入埠系結的清單。 |
outputs
必要
|
輸出埠系結的清單。 |
script_repl_params
必要
|
要在腳本中取代的選擇性參數,例如 {'param1': 'value1', 'param2': 'value2'}。 |
script_repl_params
必要
|
要在腳本中取代的選擇性參數。 |
allow_reuse
必要
|
指出當使用相同的設定重新執行時,步驟是否應該重複使用先前的結果。 預設會啟用重複使用。 如果步驟內容 (腳本/相依性) ,以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,則會立即讓任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集做為輸入,則重複使用取決於資料集的定義是否已變更,而非基礎資料是否已變更。 |
version
必要
|
要指派給步驟的版本。 |
hash_paths
必要
|
已淘汰。 檢查管線步驟內容的變更時,雜湊的路徑清單。 根據預設,中 AutoMLConfig 參數下 |
enable_default_model_output
必要
|
指出是否要將最佳模型新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取最佳模型。
請注意,如果不需要預設模型輸出,建議將此參數設定為 |
enable_default_metrics_output
必要
|
指出是否所有子執行計量都會新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取子執行計量。
請注意,如果不需要預設計量輸出,建議將此參數設定為 |
備註
透過 AutoMLStep 類別,您可以在 Azure Machine Learning 管線中執行自動化 ML 工作流程。 管線提供優點,例如可重複性、自動執行、版本設定和追蹤,以及自動化 ML 工作流程的模組化。 如需詳細資訊,請參閱 什麼是 Azure Machine Learning 管線?。
當您的自動化 ML 工作流程在管線中時,您可以排程管線以時間為基礎的排程或變更型排程執行。 時間型排程對於監視資料漂移等例行工作很有用,而變更型排程對於不規則或無法預測的變更很有用,例如資料變更時。 例如,您的排程可能會輪詢正在上傳資料的 Blob 存放區,然後在資料變更時再次執行管線,然後在執行完成後註冊新版本的模型。 如需詳細資訊,請參閱 排程機器學習管線 和 從邏輯應用程式觸發機器學習管線的執行。
下列範例示範如何建立 AutoMLStep。
automl_step = AutoMLStep(
name='automl_module',
automl_config=automl_config,
outputs=[metrics_data, model_data],
allow_reuse=True)
下列範例示範如何在 中使用 Pipeline AutoMLStep 物件。
from azureml.pipeline.core import Pipeline
pipeline = Pipeline(
description="pipeline_with_automlstep",
workspace=ws,
steps=[automl_step])
上述範例顯示管線中的一個步驟。 不過,在真實世界自動化 ML 工作流程中使用 AutoMLStep 時,您至少有一個管線步驟會在 AutoMLStep 之前執行資料準備,並在該步驟之後執行另一個管線步驟來註冊模型。 如需這類工作流程的範例,請參閱筆記本 https://aka.ms/automl-retrain-pipeline 。
若要管理、檢查狀態,以及從管線執行取得執行詳細資料,請使用 類別 AutoMLStepRun 。
如需 Azure 中自動化機器學習的詳細資訊,請參閱 什麼是自動化機器學習?一文。 如需在沒有使用管線的情況下設定自動化 ML 實驗的詳細資訊,請參閱 在 Python 中設定自動化 ML 實驗一文。
方法
create_node |
從這個 AutoML 步驟建立節點,並將 新增至指定的圖形。 這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。 |
create_node
從這個 AutoML 步驟建立節點,並將 新增至指定的圖形。
這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。
create_node(graph, default_datastore, context)
參數
名稱 | Description |
---|---|
graph
必要
|
要加入節點的繪圖物件。 |
default_datastore
必要
|
預設資料存放區。 |
context
必要
|
<xref:azureml.pipeline.core._GraphContext>
圖形內容。 |
傳回
類型 | Description |
---|---|
已建立的節點。 |
屬性
AUTOML_CONFIG_PARAM_NAME
AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'
DEFAULT_METRIC_PREFIX
DEFAULT_METRIC_PREFIX = 'default_metrics_'
DEFAULT_MODEL_PREFIX
DEFAULT_MODEL_PREFIX = 'default_model_'