はじめに
あなたは、顧客組織がハイ パフォーマンス コンピューティング (HPC) テクノロジをデプロイして運用することを支援する組織である Contoso で働いている IT 運用のプロフェッショナルです。 最近のプロジェクトには、経済予測、金融サービス、産業デザイン、人工知能などがあります。
Contoso では、そうしたプロジェクトを実行するため、Linux HPC 用のジョブ スケジューラ兼リソースマネージーとして Slurm (Simple Linux Utility for Resource Management) に大きく依存しています。 自社の既存のハードウェアは古くなって交換を必要としており、Contoso は Azure CycleCloud HPC 管理プラットフォームを使用して自社の HPC ワークロードの一部を Azure に移行することが実現可能かを検討しています。 Contoso の HPC テクノロジの管理を担当する IT プロフェッショナルとして、Slurm と Azure CycleCloud を統合し、組織の HPC コンピューティング プロジェクト ニーズを満たす方法にあなたは関心があります。
学習の目的
このモジュールを完了すると、次のことができるようになります。
- Slurm ジョブ スケジューラとリソース マネージャーについて説明する。
- Slurm と Azure CycleCloud の統合方法について説明する。
- Azure CycleCloud で実行される Slurm マネージド ジョブに関する一般的な問題のトラブルシューティングを行う。
[前提条件]
このモジュールの学習効果を最大限に高めるには、次の知識と経験を既に持っている必要があります。
- Azure CycleCloud についての基本的な理解
- HPC ジョブ管理の基本的な理解