介绍

已完成

你是 Contoso 的 IT 运营专业人员,Contoso 是一个可帮助客户组织部署和操作高性能计算 (HPC) 技术的组织。 最近的项目包括经济预测、金融服务、工业设计和人工智能。

Contoso 非常依赖 Slurm (Simple Linux Utility for Resource Management) 作为运行这些项目的 Linux HPC 群集的作业计划程序和资源管理器。 随着现有硬件的老化和更换需求,Contoso 正在探索使用 Azure CycleCloud HPC 管理平台将其部分 HPC 工作负载迁移到 Azure 的可行性。 作为负责管理 Contoso HPC 技术的 IT 专业人员,你有兴趣了解如何将 Slurm 与 Azure CycleCloud 集成以满足组织的 HPC 计算项目需求。

学习目标

学完本模块后,你将能够:

  • 介绍 Slurm 作业计划程序和资源管理器。
  • 了解如何将 Slurm 与 Azure CycleCloud 集成。
  • 排查在 Azure CycleCloud 中运行的 Slurm 托管作业的常见问题。

先决条件

要从本模块获得最佳学习体验,你应具备以下方面的知识和经验:

  • 基本了解 Azure CycleCloud
  • 基本了解 HPC 作业管理