如何使用批次端點部署管線
適用於:Azure CLI ml 延伸模組 v2 (目前)Python SDK azure-ai-ml v2 (目前)
您可以使用批次端點部署管線元件,便利地在 Azure Machine Learning 中運作元件。 在本文中,您將了解如何建立包含簡單管線的批次部署。 您將了解:
- 建立並註冊管線元件
- 建立批次端點並部署管線元件
- 測試部署
關於此範例
在此範例中,我們會一個部署管線元件,其中包含列印「hello world!」的簡單命令作業。 此元件不需要輸入或輸出,是最簡單的管線部署案例。
本文中的範例是以 azureml-examples (英文) 存放庫中包含的程式碼範例為基礎。 若要在本機執行命令,而不需要複製/貼上 YAML 和其他檔案,請複製存放庫,然後將目錄變更為該資料夾:
git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli
此範例的檔案位於:
cd endpoints/batch/deploy-pipelines/hello-batch
在 Jupyter Notebook 中跟著做
您可以在複製的存放庫中開啟 sdk-deploy-and-test.ipynb (英文) 筆記本,以便按照此範例的 Python SDK 版本說明操作。
必要條件
Azure 訂用帳戶。 如果您沒有 Azure 訂用帳戶,請在開始前建立免費帳戶。 試用免費或付費版本的 Azure Machine Learning。
Azure Machine Learning 工作區。 若要建立工作區,請參閱 管理 Azure Machine Learning 工作區。
請確定您在 Machine Learning 工作區中具有下列權限:
- 建立或管理批次端點和部署:使用允許
Microsoft.MachineLearningServices/workspaces/batchEndpoints/*
的擁有者、參與者或自訂角色。 - 在工作區資源群組中建立 Azure Resource Manager 部署:在部署工作區的資源群組中,使用允許
Microsoft.Resources/deployments/write
的擁有者、參與者或自訂角色。
- 建立或管理批次端點和部署:使用允許
安裝下列軟體以使用 Machine Learning:
執行下列命令來安裝 Azure CLI 和
ml
Azure Machine Learning 的擴充功能:az extension add -n ml
在 Azure CLI 的
ml
延伸模組 2.7 版中引進批次端點的管線元件部署。 使用az extension update --name ml
命令來取得最新版本。
連線到您的工作區
工作區是 Machine Learning 的最上層資源。 它提供集中的位置,讓您在使用 Machine Learning 時使用您所建立的所有成品。 在本節中,您會連線到要執行部署工作的工作區。
在下列命令中,輸入訂用帳戶識別碼、工作區、位置和資源群組的值:
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>
部署管線元件
批次端點可以部署模型或管線元件。 管線元件可重複使用,您可以利用共用登錄 (機器翻譯) 將這些元件從一個工作區移至另一個工作區,以簡化 MLOps 做法。
此範例中的管線元件包含單一步驟,只會在記錄中列印「hello world」訊息, 不需要任何輸入或輸出。
hello-component/hello.yml
檔案包含管線元件的設定:
hello-component/hello.yml
$schema: https://azuremlschemas.azureedge.net/latest/pipelineComponent.schema.json
name: hello_batch
display_name: Hello Batch component
version: 1
type: pipeline
jobs:
main_job:
type: command
component:
code: src
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
command: >-
python hello.py
註冊元件:
建立批次端點
提供端點名稱。 批次端點的名稱在每個區域中都不得重複,因為該名稱會用於建構叫用 URI。 若要確保名稱不重複,請將任何尾端字元附加至下列程式碼中指定的名稱。
設定端點:
建立端點:
查詢端點 URI:
部署管線元件
若要部署管線元件,我們必須建立批次部署。 部署是裝載執行實際工作的資產時所需的一組資源。
建立計算叢集。 批次端點和部署都會在計算叢集上執行。 它們可在工作區中現有的任何 Azure Machine Learning 計算叢集上執行。 因此,多個批次部署可以共用相同的計算基礎結構。 在此範例中,我們將處理名為
batch-cluster
的 Azure Machine Learning 計算叢集。 我們須確認計算存在於工作區上,否則要另外建立。設定部署:
deployment.yml
檔案包含部署的設定。 您可以查看完整的批次端點 YAML 結構描述 (機器翻譯),以取得額外的屬性。deployment.yml
$schema: https://azuremlschemas.azureedge.net/latest/pipelineComponentBatchDeployment.schema.json name: hello-batch-dpl endpoint_name: hello-pipeline-batch type: pipeline component: azureml:hello_batch@latest settings: default_compute: batch-cluster
建立部署:
您的部署已可供使用。
測試部署
建立部署後,即可接收作業。 您可以叫用預設部署,如下所示:
提示
在此範例中,管線沒有輸入或輸出。 不過,如果管線元件有需要,可以在叫用期間指定輸入或輸出。 若要了解如何指定輸入和輸出,請參閱建立批次端點的作業和輸入資料 (機器翻譯),或是如何透過前置處理部署管線以執行批次評分教學課程。
您可以使用以下命令監視記錄的顯示和串流進度:
清除資源
完成後,請從工作區中刪除相關聯的資源:
執行下列程式碼,以刪除批次端點及其基礎部署。 --yes
用來確認刪除。
az ml batch-endpoint delete -n $ENDPOINT_NAME --yes
(選擇性) 刪除計算,除非您打算在稍後的部署中重複使用計算叢集。