소개

완료됨

여러분은 클라이언트 조직이 HPC(고성능 컴퓨팅) 기술을 배포하고 운영하는 데 도움이 되는 조직인 Contoso의 IT 운영 전문가입니다. 최근 프로젝트에는 경제 예측, 금융 서비스, 산업 설계, 인공 지능이 포함됩니다.

Contoso는 이런 프로젝트가 실행되는 Linux HPC 클러스터의 작업 스케줄러 및 리소스 관리자로서 Slurm(리소스 관리를 위한 간단한 Linux 유틸리티)에 크게 의존합니다. 기존 하드웨어가 노후화되어 바꿀 필요가 있음에 따라 Contoso는 Azure CycleCloud HPC 관리 플랫폼을 사용하여 일부 HPC 워크로드를 Azure로 이전하는 것이 가능한지 알아보고 있습니다. Contoso의 HPC 기술 관리를 담당하는 IT 전문가로서 Slurm을 Azure CycleCloud와 통합하여 조직의 HPC 컴퓨팅 프로젝트 요구 사항을 어떻게 충족하는지를 이해하는 데 관심이 있습니다.

학습 목표

이 모듈을 마치면 다음을 수행할 수 있습니다.

  • Slurm 작업 스케줄러 및 리소스 관리자에 대해 설명합니다.
  • Slurm이 Azure CycleCloud와 통합되는 방식을 이해합니다.
  • Azure CycleCloud에서 실행되는 Slurm 관리형 작업의 일반적인 문제를 해결합니다.

필수 구성 요소

이 모듈에서 최상의 학습 경험을 얻으려면 다음 지식과 경험이 이미 있어야 합니다.

  • Azure CycleCloud에 대한 기본 이해
  • HPC 작업 관리에 대한 기본 이해