Azure 基礎結構上的 AI 實作選項
本文提供在 Azure 基礎結構上執行 AI 工作負載的組織實作建議(IaaS)。 部署 Azure 登陸區域之後,您可以使用 CycleCloud Workspace for Slurm 來設定應用程式登陸區域。 適用於 Slurm 的 Azure CycleCloud 工作區為想要使用 Slurm 排程器執行 AI 工作負載的使用者提供數個優點。
建立簡單且快速的叢集。 用戶可以透過簡單的 GUI 在 Azure 上快速建立 Slurm 叢集。 他們可以選擇各種 Azure 虛擬機(VM)大小和類型,並自定義叢集設定,例如節點計數、網路設定、記憶體選項(例如 Azure NetApp Files 和 Azure 受控 Lustre 檔案系統),以及 Slurm 參數。
彈性和動態叢集管理。 Azure CycleCloud 會自動相應增加或減少 Slurm 叢集。 用戶可以監視叢集狀態、效能和使用率,以及透過 GUI 檢視記錄和計量。 它們可在不需要時刪除叢集,並只支付其使用的資源費用。
完全控制基礎結構。 使用者完全控制已部署的基礎結構,讓他們攜帶自己的程式代碼、連結庫和套件,以及視需要使用資源。
設計指導方針
下列文章提供 Azure 基礎結構上 AI 工作負載的指導方針(IaaS):
架構
圖 1.Azure 登陸區域中 Azure 基礎結構上的 AI 應用程式。
部署 Slurm 的 CycleCloud 工作區
CycleCloud Workspace for Slurm 可用來作為企業環境中的初始部署。 您可以開發和自定義程式碼,以擴充其功能和/或將其調整為 Azure 登陸區域環境。 然後,遵循指引, 使用適用於 Slurm 的 Azure CycleCloud 工作區,從擁抱臉部微調擴散模型。