Définir des nœuds exclus pour un travail
Dans HPC Pack, si vous remarquez que les tâches de votre travail échouent de manière cohérente sur un nœud particulier, vous pouvez exclure ce nœud de votre travail en l’ajoutant à la propriété Nœuds exclus tâche. Lorsque vous spécifiez des nœuds dans les nœuds exclus :
Les tâches du travail en cours d’exécution sur un nœud qui a été ajouté à
nœuds exclus sont annulées et marquées commeéchec (à l’exception des tâches de mise en production de nœud). mise en production de nœud tâches s’exécutent sur le nœud exclu avant la publication du nœud.
Aucune tâche du travail n’est démarrée sur les nœuds répertoriés dans Nœuds exclus.
Si les ajouts aux nœuds exclus liste entraînent la suppression du travail en dessous de ses exigences minimales en matière de ressources, le travail est annulé et mis à la file d’attente.
Pour tout travail actif que vous possédez, vous pouvez ajouter ou supprimer des nœuds dans la propriété Nœuds exclus propriété travaux, ou effacer la liste. L’exemple suivant répertorie les commandes permettant de modifier et d’afficher la liste nœuds exclus à l’aide de HPC PowerShell ou d’une invite de commandes.
Dans HPC PowerShell, utilisez les applets de commande suivantes :
Set-HpcJob –Id <yourJobID> /addExludedNodes <nodeName>, <nodename>
Set-HpcJob –Id <yourJobID> /removeExcludedNodes <nodeName>, <nodename>
Set-HpcJob –Id <yourJobID> /clearExcludedNodes
(Get-HpcJob –Id <yourJobID>).ExcludedNodes
Ou pour afficher toutes les propriétés du travail,
Get-HpcJob –Id <yourJobID>|fl
À l’invite de commandes, utilisez les commandes suivantes :
job modify <yourJobID> /addExludedNodes:<nodeName>,<nodename>
job modify <yourJobID> /removeExcludedNodes:<nodeName>,<nodename>
job modify <yourJobID> /clearExcludedNodes
job view <yourJobID> /detailed|find “excludednodes” /i
Ou pour afficher toutes les propriétés du travail,
job view <yourJobID> /detailed
Remarque
Pour les travaux SOA, le nœud broker met automatiquement à jour et gère la liste des nœuds exclus conformément au paramètre EndPointNotFoundRetryPeriod (dans le fichier de configuration du service). Ce paramètre spécifie la durée pendant laquelle l’hôte de service doit réessayer de charger le service et combien de temps le répartiteur doit attendre une connexion. Si ce temps s’écoule, le répartiteur ajoute le nœud (hôte de service) à la liste Nœuds exclus. La configuration du service inclut également le paramètre maxExcludedNodes qui spécifie le nombre de nœuds pouvant être exclus avant l’échec de la session.
Voir aussi
soumission de travaux dans microsoft HPC Pack