介绍

已完成

想象一下,你在一家汽车制造商的研发团队中工作。 你的团队正使用 Azure 高性能计算 (HPC) 资源来设计和开发新的旗舰跑车。

你的团队在 Azure HPC SKU 上创建了紧密耦合 HPC 应用程序。 但是,他们在 Azure 中运行 HPC 作业时发现一些问题。 一些紧密耦合的消息传递接口 (MPI) 作业无法正常运行,而另一些作业的运行速度低于预期。 你的团队需要进行故障排除,以查明一些 HPC 应用程序会出现运行时故障以及另一些 HPC 应用程序的性能低于预期的原因。

学习目标

在本模块中,你将了解如何:

  • 对紧密耦合 HPC 应用程序的运行时故障进行故障排除。
  • 对性能不佳的紧密耦合 HPC 应用程序进行故障排除。

先决条件

  • HPC 概念的基础知识。
  • 熟悉如何在 Azure 上生成和运行紧密耦合 HPC 应用程序。