はじめに

完了

あなたは、顧客組織がハイ パフォーマンス コンピューティング (HPC) テクノロジをデプロイして運用することを支援する組織である Contoso で働いている IT 運用のプロフェッショナルです。 最近のプロジェクトには、経済予測、金融サービス、産業デザイン、人工知能などがあります。

Contoso では、そうしたプロジェクトを実行するため、Linux HPC 用のジョブ スケジューラ兼リソースマネージーとして Slurm (Simple Linux Utility for Resource Management) に大きく依存しています。 自社の既存のハードウェアは古くなって交換を必要としており、Contoso は Azure CycleCloud HPC 管理プラットフォームを使用して自社の HPC ワークロードの一部を Azure に移行することが実現可能かを検討しています。 Contoso の HPC テクノロジの管理を担当する IT プロフェッショナルとして、Slurm と Azure CycleCloud を統合し、組織の HPC コンピューティング プロジェクト ニーズを満たす方法にあなたは関心があります。

学習の目的

このモジュールを完了すると、次のことができるようになります。

  • Slurm ジョブ スケジューラとリソース マネージャーについて説明する。
  • Slurm と Azure CycleCloud の統合方法について説明する。
  • Azure CycleCloud で実行される Slurm マネージド ジョブに関する一般的な問題のトラブルシューティングを行う。

[前提条件]

このモジュールの学習効果を最大限に高めるには、次の知識と経験を既に持っている必要があります。

  • Azure CycleCloud についての基本的な理解
  • HPC ジョブ管理の基本的な理解