Häufige Probleme: Slurm-Konfigurationsfehler
Mögliche Fehlermeldungen
Unable to execute command /usr/bin/systemctl --system start slurmd
Lösung
Da Slurm alle Knoten eines Clusters in slurm.conf definiert werden muss, erstellt CycleCloud alle VMs innerhalb von CycleCloud vor, wenn der Planerknoten zuerst gestartet wird. Diese VMs bleiben in Azure nicht zugeordnet, bis ein Auftrag sie anfordert, aber manchmal können unzureichende Kontingent- oder falsche Autoskalengrenzwerte zu Installationsproblemen führen.
- Stellen Sie sicher, dass Ihr Abonnement über genügend Kontingent für den ausgewählten VM-Typ verfügt und dass die Grenzwerte für die automatische Skalierung unter dem Kontingentbetrag liegen. Möglicherweise müssen Sie einen anderen VM-Typ auswählen oder Ihre Grenzwerte für die automatische Skalierung entsprechend anpassen.
-
/var/log/slurmctld/slurm.log
Überprüfen Sie, ob Fehler beim Starten des Zeitplans auftreten.