다음을 통해 공유


일반적인 문제: Slurm 구성 오류

가능한 오류 메시지

  • Unable to execute command /usr/bin/systemctl --system start slurmd

해결 방법

Slurm을 사용하려면 클러스터의 모든 노드를 slurm.conf에 정의해야 하므로 CycleCloud는 스케줄러 노드가 처음 시작될 때 CycleCloud 내에 모든 VM을 미리 만듭니다. 이러한 VM은 작업에서 요청할 때까지 Azure에서 할당되지 않은 상태로 유지되지만 때로는 할당량 부족 또는 잘못된 자동 크기 조정 제한으로 인해 설치 문제가 발생할 수 있습니다.

  • 구독에 선택한 VM 유형에 대한 할당량이 충분하고 자동 크기 조정 제한이 할당량 크기보다 낮은지 확인합니다. 다른 VM 유형을 선택하거나 그에 따라 자동 크기 조정 제한을 조정해야 할 수 있습니다.
  • /var/log/slurmctld/slurm.log 스케줄러 시작과 관련된 오류가 있는지 확인합니다.