什麼是 Azure Machine Learning 工作區?
工作區是與同事共同作業的地方,可建立機器學習成品和群組相關工作。 例如,實驗、作業、資料集、模型、元件和推斷端點。 本文說明工作區、如何管理其存取權,以及如何用來組織您的工作。
準備開始了嗎? 建立工作區。
在工作區內執行的工作
針對機器學習小組,工作區是組織其工作的地方。 以下是您可以從工作區開始的一些工作:
- 建立作業 - 作業是您用來建置模型的定型回合。 您可以將作業分組為實驗來比較計量。
- 作者管線 - 管線是可重複使用的工作流程,用於定型和重新定型您的模型。
- 註冊資料資產 - 資料資產可協助您管理用於模型定型和管線建立的資料。
- 註冊模型 - 當您擁有想要部署的模型之後,即可建立已註冊的模型。
- 建立線上端點 - 使用已註冊的模型和評分指令碼以建立線上端點。
- 部署模型 - 使用已註冊的模型和評分指令碼以部署模型。
除了將機器學習結果分組之外,工作區也會裝載資源設定:
組織工作區
針對機器學習小組負責人和系統管理員,工作區可作為存取權管理、成本管理和資料隔離的容器。 以下是組織工作區的一些提示:
- 使用使用者角色,用於使用者之間工作區中的權限管理。 例如,資料科學家、機器學習工程師或系統管理員。
- 將存取權指派給使用者群組:藉由使用 Microsoft Entra 使用者群組,您不需要將個別使用者新增至每個工作區,相同群組的使用者需要存取權的其他資源也一樣。
- 建立每個專案的工作區:雖然工作區可以用於多個專案,但將其限製為每個工作區一個專案可讓成本報告累算至專案層級。 也可讓您管理每個專案範圍內的資料存放區等設定。
- 共用 Azure 資源:工作區會要求您建立數個相關聯的資源。 在工作區之間共用這些資源,以儲存重複的設定步驟。
- 啟用自助:以 IT 系統管理員身分預先建立及保護相關聯的資源,並使用使用者角色讓資料科學家自行建立工作區。
- 共用資產:您可以使用 Azure Machine Learning 登錄在工作區之間共用資產。
我的內容如何儲存在工作區中?
您的工作區保留所有定型執行的歷程記錄,包括記錄、計量、輸出,資料譜系中繼資料以及指令碼的快照集。 當您在 Azure Machine Learning 中執行工作時,會產生成品。 其中繼資料和資料會儲存在工作區及其相關聯的資源上。
相關聯的資源
當您建立新的工作區時,必須攜帶其他 Azure 資源來儲存您的資料。 如果您未提供,Azure Machine Learning 會自動建立這些資源。
Azure 儲存體帳戶。 儲存機器學習成品,例如作業記錄。 根據預設,當您將資料上傳至工作區時,會使用此儲存體帳戶。 此處亦會儲存與 Azure Machine Learning 計算執行個體搭配使用的 Jupyter 筆記本。
重要
如果現有的 Azure 儲存體帳戶為下列任一項,則「無法」使用:
- BlobStorage 類型的帳戶
- Premium 帳戶 (Premium_LRS 和 Premium_GRS)
- 具有階層命名空間的帳戶 (與 Azure Data Lake Storage Gen2 搭配使用)。
您可以藉由建立資料存放區,使用進階儲存體或階層命名空間作為額外儲存體。
升級至一般用途 v2 之後,請勿在儲存體帳戶上啟用階層命名空間。
如果您攜帶現有的一般用途 v1 儲存體帳戶,您可以在建立工作區之後,將其升級為一般用途 v2。
Azure Container Registry (ACR)。 當您透過 Azure Machine Learning 建置自訂環境時,會儲存已建立的 Docker 容器。 部署 AutoML 模型和資料設定檔也會觸發建立自訂環境。
如果您不需要建置自訂 Docker 容器,您「可以」建立不相依於 ACR 的工作區。 Azure Machine Learning 可以從外部容器登錄讀取。
當您建置自訂 Docker 映像時,就會自動佈建 ACR。 使用 Azure 角色型存取控制 (Azure RBAC) 可防止建置客戶 Docker 容器。
重要
如果您的訂用帳戶設定需要將標籤新增至其下的資源,Azure Machine Learning 所建立的 ACR 將會失敗,因為我們無法將標籤設定為 ACR。
Azure Application Insights。 協助您從推斷端點監視和收集診斷資訊。
如需詳細資訊,請參閱監視線上端點。
Azure Key Vault。 儲存計算目標所使用的祕密與工作區所需的其他敏感性資訊。
建立工作區
有多種方式可建立新的工作區。 若要開始進行,請使用下列其中一個選項:
- Azure Machine Learning 工作室可讓您採用預設設定快速建立工作區。
- 使用 Azure 入口網站,建立有更多安全性選項的點選介面。
- 如果您在 Visual Studio Code 中工作,請使用 VS Code 延伸模組。
若要使用您慣用的安全性設定將工作區建立自動化:
- Azure Resource Manager /Bicep 範本提供宣告式語法來部署 Azure 資源。 另一個選項是使用 Terraform。 另請參閱 Bicep 範本或 Terraform 範本。
- 使用 Azure Machine Learning CLI 或 Azure Machine Learning SDK for Python 進行原型設計,以及作為 MLOps 工作流程的一部分。
- 使用 Azure Machine Learning CLI 或 Azure Machine Learning SDK for Python 進行原型設計,以及作為 MLOps 工作流程的一部分。
- 針對平台整合或是在 MLOps 工作流程中,直接在指令碼環境中使用 REST API。
工作區互動和管理的工具
設定您的工作區之後,您可以透過下列方式與其互動:
- 在具有 Azure Machine Learning SDK 的任何 Python 環境中。
- 在命令列上,使用 Azure Machine Learning CLI 延伸模組 v2
- 在具有 Azure Machine Learning SDK 的任何 Python 環境中
- 在命令列上,使用 Azure Machine Learning CLI 延伸模組 v1
下列工作區管理工作可在每個介面中使用。
工作區管理工作 | 入口網站 | Studio | Python SDK | Azure CLI | VS 程式碼 |
---|---|---|---|---|---|
建立工作區 | |||||
管理工作區存取 | |||||
建立及管理計算資源 | |||||
建立運算執行個體 |
警告
不支援將 Azure Machine Learning 工作區移至不同的訂用帳戶,或將擁有的訂用帳戶移至新租用戶。 這麼做可能會導致錯誤。
子資源
當您在 Azure Machine Learning 中建立計算叢集和計算執行個體時,會建立子資源。
- VM:提供計算執行個體和計算叢集的運算能力,以供您用來執行作業。
- Load Balancer:為每個計算執行個體和計算叢集建立網路負載平衡器以管理流量,即使計算執行個體/叢集已停止亦然。
- 虛擬網路:可協助 Azure 資源與另一個資源、網際網路和其他內部部署網路進行通訊。
- 頻寬:封裝跨區域的所有輸出資料傳輸。
下一步
如要深入瞭解如何針對組織的需求規劃工作區,請參閱組織和設定 Azure Machine Learning。
若要開始使用 Azure Machine Learning,請參閱: