共用方式為


HPC 登陸區域

Azure 雲端採用架構 的就緒方法可引導您準備環境以進行雲端採用。 在整備階段,您可以使用 Azure 登陸區域。 登陸區域是技術加速器,可為任何雲端採用環境提供基本建置組塊。 登陸區域可將 Azure 環境的設定自動化,並配合 雲端採用架構 的最佳做法指引。 在準備高效能運算 (HPC) 時,您可能會遇到環境設定,視您的產業使用案例和需求而定。

Azure 登陸區域概念架構

當您準備環境以進行持續雲端採用時,您可以使用代表目標結束狀態的 Azure 登陸區域概念架構。 針對 HPC,有多個概念架構參考,這些參考是以 雲端採用架構 目前所解決的三個產業為基礎:

當您開發登陸區域的長期願景時,請考慮這些架構參考。 這些參考提供起點。 根據貴組織的商務需求和使用者的需求,您可能需要修改它們。

HPC 評估

您在策略影響評估和技術規劃期間所做的決策會影響您在 Azure 上針對 HPC 部署選擇的登陸區域設定。 建議您考慮下列問題:

  • Azure 上的環境有多成熟? 是否在概念證明階段? 還是已經是為使用者提供服務的成熟應用程式? 視其階段而定,您可以包含或省略治理、安全性或資源組織。
  • 您要建置在 Azure 短期或長期專案上的應用程式嗎? 此問題的解答可協助您選擇計算和記憶體選項。
  • 您的組織是否需要人員存取不同層級的 Azure 資源?

如您所見,部署模型會根據您的商務、產業和應用程式使用量而有所不同。

HPC 的 Azure 登陸區域加速

Azure BatchAzure CycleCloud 都是 Azure 提供的第一方服務,而 Azure HPC OnDemand PlatformAzHOP) 是建置在 Azure Cycle Cloud 之上的自動化,可提供 Azure 中完整 HPC 叢集解決方案的端對端部署機制。

Azure Batch

  • Batch 的設計目的是在 Azure 中有效率地執行大規模平行和 HPC 批次作業。
  • Batch 會建立和管理計算節點或虛擬機集區(VM)。 您也可以使用 Batch 來安裝您想要執行的應用程式,以及排程要在節點上執行的作業。
  • 沒有可安裝、管理或調整的叢集或工作排程器軟體。
  • Batch 適用於內部平行工作負載。 這些工作負載具有可以獨立執行的應用程式,每個實例都會完成部分工作。
  • 您也可以使用 Batch 來執行緊密結合的工作負載,其中執行的應用程式需要彼此通訊,而不是獨立執行。
  • Batch 工作可以直接在 Batch 集區中的 VM 或節點上執行。 但您也可以設定 Batch 集區,以在節點上的 Docker 相容容器中執行工作。

Azure CycleCloud

  • 它支援各種 HPC 排程器,例如 SLURM、OpenPBS、PBSPro、LSF、Grid Engine 和 HTCondor12。
  • 它可讓您布建 HPC 系統的基礎結構,例如虛擬機、擴展集、網路介面和磁碟。
  • 它會根據作業負載、可用性和時間需求,自動調整基礎結構,以在任何規模上有效率地執行作業。
  • 它提供豐富的宣告式範本化格式,以在 Azure 上建構完整的 HPC 環境。
  • 它與 Azure 服務整合,例如 Azure 監視器和 Microsoft 成本管理工具。

AzHop

  • AzHop 會使用 CycleCloud 來協調作業,為 Azure 上的基底 HPC 基礎結構提供端對端部署機制。
  • 它提供完整的 HPC 叢集解決方案,可供使用者執行應用程式,且可讓 HPC 系統管理員輕鬆部署和管理。
  • AzHop 使用內建的各種應用程式,您可以使用「照樣」,或者您可以輕鬆地自定義和擴充,以符合任何未滿足的需求。
  • 其中包含 Open OnDemand 入口網站,可用於統一使用者存取、遠端殼層存取、遠端視覺效果存取、作業提交、檔案存取等等。
  • 它會使用 Active Directory 進行使用者驗證和網域控制。
  • 它會使用 OpenPBS 或 Simple Linux 公用程式作為資源管理 (SLURM) 做為作業排程器。
  • 動態資源布建和自動調整是由 CycleCloud 預先設定的工作佇列和整合式健康狀態檢查來完成,以快速避免非最佳節點。
  • Azure NetApp Files 會為主目錄和應用程式提供共用文件系統。

比較圖表

功能 Azure Batch Azure CycleCloud
排程器 Batch API 和工具可供使用。 您也可以在 Azure 入口網站 中使用雲端原生命令行腳本。 您可以使用標準 HPC 排程器,例如 SLURM、OpenPBSPBSProLSFGrid EngineHTCondor 或者,您可以擴充 Azure CycleCloud 自動調整外掛程式,以使用您自己的排程器。
計算資源 軟體即服務 (SaaS) 節點 – 平臺即服務 (PaaS)。 PaaS 軟體 – PaaS。
監視工具 Azure 監視器。 Azure 監視器和 Grafana。
自訂 您可以使用自訂映像集區、第三方映像或 Batch API 存取。 您可以使用完整的 RESTful API 來自定義和擴充功能、部署您自己的排程器,以及支援現有的工作負載管理員。
整合 Azure Synapse Analytics 管線、Azure Data Factory 和 Azure CLI。 適用於 Windows 和 Linux 的內建 CLI。
使用者類型 開發人員。 傳統 HPC 系統管理員和使用者。
工作類型 批次和工作流程。 使用訊息傳遞介面 (MPI) 的緊密結合工作流程。
Windows 支援 提供。 取決於排程器選擇。

Azure CycleCloud 和 Azure Batch 是 Azure 上 HPC 工作的強大工具,但專為不同的使用案例所設計。

Azure CycleCloud 是一種企業易用的工具,可用來協調和管理 Azure 上的 HPC 環境。 其以 HPC 系統管理員和想要以特定排程器部署 HPC 環境的用戶為目標。 Azure CycleCloud 提供強大的工具,在 Azure 上建構完整的 HPC 環境,包括網路檔案共用 (NFS) 伺服器、平行文件系統、登入主機、授權伺服器和目錄服務。 對於已操作 HPC 環境一段時間且累積多年專業知識和內部工具的特定排程器的組織而言,這非常有用。

相反地,Batch 主要針對在自己的產品或服務中建置功能的開發人員和小組。 Batch 包含自己的排程器,其設計目的是在沒有叢集或作業排程器軟體的情況下有效率地執行大規模的平行作業。 當您不需要管理工作負載排程器時,Batch 會很有用。

總而言之,當您想要以特定排程器部署 HPC 環境,並需要完整的 HPC 環境時,請使用 Azure CycleCloud。 當您開發需要大規模平行處理且不想管理工作負載排程器的產品或服務時,請使用 Batch。

下一步