共用方式為


Azure Machine Learning 作為雲端規模分析的數據產品

Azure Machine Learning 是整合式平臺,可讓您從頭到尾管理機器學習生命週期,包括協助建立、作業和取用機器學習模型和工作流程。 服務的一些優點包括:

  • 功能可支援建立者藉由協助他們管理實驗、存取數據、追蹤作業、微調超參數,以及自動化工作流程,來提升其生產力。

  • 模型具備說明、重現、稽核及與 DevOps 結合的能力,並結合豐富的安全控制模型,可以支持操作員滿足治理和合規性需求。

  • 受控推斷功能和與 Azure 計算和數據服務的強固整合,有助於簡化服務的取用方式。

Azure Machine Learning 涵蓋數據科學生命週期的所有層面。 它涵蓋從數據存放區和數據集註冊到模型部署的過程。 它可用於任何類型的機器學習,從傳統機器學習到深度學習。 它包括受監督和不受監督的學習。 無論您偏好撰寫 Python、R 程式代碼,還是使用零程式代碼或低程式碼選項,例如設計工具,都可以在 Azure Machine Learning 工作區中建置、定型和追蹤精確的機器學習和深度學習模型。

Azure Machine Learning、Azure 平臺和 Azure AI 服務可以共同運作,以管理機器學習生命週期。 機器學習從業者可以使用 Azure Synapse Analytics、Azure SQL Database 或 Microsoft Power BI,開始分析數據並轉換至 Azure Machine Learning,以進行原型設計、管理實驗和作業化。 在 Azure 登陸區域中,Azure Machine Learning 可視為 數據產品

雲端規模分析中的 Azure Machine Learning

雲端採用架構 (CAF) 登陸區域基礎、雲端規模分析數據登陸區域,以及 Azure Machine Learning 的設定會使用預先設定的環境來設定機器學習專業人員,讓他們可以重複部署新的機器學習工作負載或移轉現有的工作負載。 這些功能可協助機器學習專業人員獲得更高的靈活性,並讓他們的時間更有價值。

下列設計原則可引導 Azure Machine Learning Azure 登陸區域的實作:

  • 加速數據存取: 預先設定登陸區域記憶體元件作為 Azure Machine Learning 工作區中的數據存放區。

  • 啟用共同作業: 依項目組織工作區,並集中管理登陸區域資源的存取管理,以支持數據工程、數據科學和機器學習專業人員共同合作。

  • 安全實作: 作為每個部署的預設值,請遵循最佳做法並使用網路隔離、身分識別和存取管理來保護數據資產。

  • 自助: 機器學習專業人員可以藉由探索部署新專案資源的選項,以獲得更高的靈活性和組織性。

  • 數據管理和數據使用之間的職責分離: 身分識別傳遞是 Azure Machine Learning 和儲存體的預設驗證類型。

  • 更快速的數據應用程式(來源對齊): Azure Data Factory、Azure Synapse Analytics 和 Databricks 登陸區域可以預先設定為連結至 Azure Machine Learning。

  • 可檢視性: 集中記錄和參考組態可協助監視環境。

實作概觀

注意

本節建議雲端規模分析特有的設定。 此內容可補充 Azure 機器學習文件和雲端採用架構的最佳實務。

工作區組織和設定

您可以部署工作負載所需的機器學習工作區數目,以及為每個您部署的著陸區建立相應的工作區。 下列建議可協助您的設定:

  • 每個專案至少部署一個機器學習工作區。

  • 根據您的機器學習專案的生命週期,將一個開發(開發)工作區部署到原型使用案例,並儘早探索數據。 針對需要持續實驗、測試和部署的工作,請部署預備和生產工作區。

  • 當數據登陸區域中開發、預備和生產工作區需要多個環境時,建議您避免數據重複,方法是讓每個環境都登陸相同的生產數據登陸區域。

  • 請參閱 組織及設定 Azure Machine Learning 環境,以深入瞭解如何組織和設定 Azure Machine Learning 資源。

針對數據登陸區域中的每個預設資源組態,Azure Machine Learning 服務會部署在具有下列設定和相依資源的專用資源群組中:

  • Azure Key Vault
  • Application Insights
  • Azure 容器註冊表
  • 使用 Azure Machine Learning 連線到 Azure 儲存帳戶,並使用 Microsoft Entra 基於身分識別的驗證,以協助用戶連線到該帳戶。
  • 系統會為每個工作區設定診斷記錄,並設定為企業級的中央Log Analytics資源;這可協助 Azure Machine Learning 作業健康情況和資源狀態在登陸區域內和跨登陸區域集中分析。
  • 請參閱 什麼是 Azure Machine Learning 工作區? 深入瞭解 Azure Machine Learning 資源和相依性。

與數據著陸區核心服務整合

資料登陸區域隨附一組預設服務,這些服務部署在 平台服務層中。 在數據登陸區域中部署 Azure Machine Learning 時,可以設定這些核心服務。

  • 將 Azure Synapse Analytics 或 Databricks 工作區連線為連結服務,以整合數據和處理巨量數據。

  • 根據預設,數據湖服務會布建在數據登陸區域中,而 Azure Machine Learning 產品部署會隨附預先設定至這些記憶體帳戶的連線(數據存放區)。

Azure Machine Learning 的數據產品分析概觀。

網路連線能力

在 Azure 登陸區域中實作 Azure Machine Learning 的網路功能是使用 Azure Machine Learning 和 CAF 網路最佳做法設定 安全性最佳做法。 這些最佳做法包括下列設定:

  • Azure Machine Learning 和相依資源已設定為使用 Private Link 端點。
  • 受控計算資源只會使用私人IP位址進行部署。
  • 您可以在網路層級設定 Azure Machine Learning 公用基底映射存放庫和合作夥伴服務,例如 Azure Artifacts 的網路連線。

身分識別和存取管理

請考慮使用 Azure Machine Learning 管理使用者身分識別和存取權的下列建議:

  • 您可以將 Azure Machine Learning 中的數據存放區設定為使用認證或身分識別型驗證。 當您在 Azure Data Lake Storage Gen2中使用 訪問控制和數據湖組態時,請將數據存放區設定為使用身分識別型驗證;這可讓 Azure Machine Learning 將記憶體的使用者存取許可權優化。

  • 使用Microsoft Entra 群組來管理記憶體和機器學習資源的用戶許可權。

  • Azure Machine Learning 可以使用 使用者指派的受控識別進行訪問控制,並限制對 Azure Container Registry、Key Vault、Azure 記憶體和 Application Insights 的存取範圍。

  • 將使用者指派的受控識別建立至在 Azure Machine Learning 中建立的受控計算叢集。

透過自助提供基礎設施

自助服務可以使用 原則在 Azure Machine Learning啟用及管理。 下表列出一組部署 Azure Machine Learning 時的默認原則。 如需詳細資訊,請參閱 Azure Machine Learning的 Azure 原則內建原則定義。

政策 類型 參考
Azure Machine Learning 工作區應該使用 Azure Private Link。 內置 Azure 入口網站檢視
Azure Machine Learning 工作區應該使用使用者指派的受控識別。 內建 在 Azure 入口網站中檢視
[預覽]:為指定的 Azure Machine Learning 計算資源設定允許的註冊表。 內建 在 Azure 入口網站中檢視
使用私人端點設定 Azure Machine Learning 工作區。 內建 Azure 入口網站中的 檢視
設定機器學習計算以停用本機驗證方法。 內建 在 Azure 入口網站中查看
附加機器學習計算設置腳本創建腳本 自訂 (CAF 登陸區域) 在 GitHub 上查看
Deny-machinelearning-hbiworkspace 自訂 (CAF 登陸區域) 在GitHub上檢視
拒絕當機器學習系統位於虛擬網路後的公共訪問 自訂 (CAF 登陸區域) GitHub 上的 檢視
拒絕-machinelearning-AKS 自定義(CAF 登陸區域) GitHub 上查看
Deny-machinelearningcompute-subnetid 自訂(CAF 登陸區域) 在 GitHub 上檢視
Deny-機器學習計算-虛擬機大小 自訂 (CAF 降落區域) GitHub 上的 檢視
"拒絕-機器學習計算叢集-遠端登入端口公共訪問" 自訂 CAF 登陸區域 GitHub 上的 檢視
Deny-machinelearningcomputecluster-scale 自訂 [CAF 著陸區] GitHub 上的檢視

管理環境的建議

雲端規模分析數據登陸區域概述可重複部署的參考實作,可協助您設定可管理且可控管的環境。 請考慮使用 Azure Machine Learning 來管理環境的建議:

  • 使用Microsoft Entra 群組來管理機器學習資源的存取權。

  • 發佈中央監視儀錶板,以監視機器學習的管線健康情況、計算使用率和配額管理。

  • 如果您傳統上使用內建的 Azure 原則,且需要符合其他合規性需求,請建置自定義 Azure 原則來增強治理和自助。

  • 若要追蹤研發成本,請在探索使用案例的早期階段,將登陸區域中的一個機器學習工作區部署為共用資源。

重要

使用 Azure Machine Learning 叢集進行生產等級模型定型,並使用 Azure Kubernetes Service (AKS) 進行生產等級部署。

提示

使用 Azure Machine Learning 進行數據科學專案。 其涵蓋具有子服務和功能的端到端工作流程,並允許流程完全自動化。

後續步驟

使用 數據產品分析 範本和指引,用於部署 Azure Machine Learning,並參考 Azure Machine Learning 文件和教學指南, 以開始構建您的解決方案。

請繼續閱讀下列四篇雲端採用架構文章,以深入瞭解適用於企業的 Azure Machine Learning 部署和管理最佳做法: