Partilhar via


Questões Comuns: Erros de configuração do Slurm

Possíveis mensagens de erro

  • Unable to execute command /usr/bin/systemctl --system start slurmd

Resolução

Como o Slurm requer que todos os nós de um cluster sejam definidos em slurm.conf, o CycleCloud pré-cria todos os VMs dentro do CycleCloud quando o nó do programador é iniciado pela primeira vez. Estes VMs permanecem não atribuídos em Azure até que um trabalho os solicite, mas por vezes insuficientes quota ou limites de autoescala incorretos podem causar problemas de instalação.

  • Certifique-se de que a sua subscrição tem quota suficiente para o tipo VM selecionado e que os limites de autoescala estão abaixo do valor da quota. Pode ter de selecionar um tipo VM diferente ou ajustar os seus limites de autoescala em conformidade.
  • /var/log/slurmctld/slurm.log Verifique se há erros relacionados com o início do programador.