Partager via


Présentation des états du travail et des tâches

Dans HPC Pack, les travaux et les tâches ont des états de cycle de vie presque identiques. Les états principaux du cycle de vie sont Configuration de, mis en file d’attente, exécution, terminé, échec et annulé. Les travaux et les tâches passent également par des états transitionnels brefs. Le tableau suivant récapitule tous les états de cycle de vie.

États du travail et de la tâche

État Définition
configuration de Le travail ou la tâche se trouve dans le système, mais n’a pas été soumis à la file d’attente.
soumis Le travail ou la tâche a été envoyé et attend la validation avant de pouvoir être mis en file d’attente.
validation des Le service planificateur de travaux HPC valide le travail ou la tâche. Pendant la validation, le service HPC Job Scheduler confirme les autorisations, applique les paramètres par défaut pour toutes les propriétés que le propriétaire du travail n’a pas spécifiées et valide chaque propriété par rapport aux contraintes. Les paramètres et contraintes par défaut sont définis par le modèle de travail. Pour plus d’informations sur les modèles de travail, consultez Understanding Job Templates - Job Manager. Le service HPC Job Scheduler confirme également que les propriétés du travail englobent toutes les propriétés de tâche (par exemple, aucune tâche n’a une durée d’exécution supérieure à l’heure d’exécution du travail).

Pendant la validation, le travail peut également passer par une application de filtre de soumission personnalisée définie par l’administrateur du cluster.

Si le travail réussit la validation, il passe à l’état mis en file d’attente. Si le travail ne passe pas la validation, le travail affiche un message d’erreur et le travail passe à l’état Échec.
en file d’attente Le travail ou la tâche a passé la validation et attend d’être planifié et activé (exécution).

Lors d’un travail en cours d’exécution, une tâche de base ou un balayage paramétrique sous-tâche est préempté par le service planificateur de travaux HPC, il revient à l’état mis en file d’attente (sauf si la tâche n’est pas réexécutée, auquel cas elle est marquée comme échec). Remarque : dans HPC Pack 2012, l’option par défaut pour le comportement de préemption dans mode de planification mis en file d’attente est la préemption immédiate au niveau des tâches, plutôt que la préemption au niveau du travail.
dispatching Cet état s’applique uniquement aux tâches. Le service hpC Job Scheduler a alloué des ressources à la tâche et contacte les nœuds alloués pour commencer à exécuter la tâche. Au démarrage de la tâche, elle passe à l’état En cours d’exécution.
en cours d’exécution Le travail ou la tâche s’exécute sur un ou plusieurs nœuds.
finition Le travail ou la tâche terminée, et le nettoyage de tâche ou de tâche est en cours.
terminé Le travail ou la tâche s’est terminé avec succès.
échec Le travail ou la tâche n’a pas pu s’exécuter, s’est arrêté ou retourné un code de sortie qui indique l’échec (par défaut, tout code de sortie différent de zéro).

En outre, une tâche en cours d’exécution est marquée comme échec quand :

- Le propriétaire du travail ou un administrateur de cluster annule la tâche.
- Le service hpC Job Scheduler annule une tâche, car elle a dépassé son runtime maximal.
- Le service du planificateur de travaux HPC préempt une tâche qui n’est pas marquée comme réexécuter.
- Le service du planificateur de travaux HPC préempt une sous-tâche démarrée par ressource (de préparation de nœud, de mise en production de nœud et service sous-tâches).

Si un travail ou une tâche ne parvient pas à démarrer en raison d’un échec de cluster, le travail ou la tâche est automatiquement retenté plusieurs fois avant qu’elle ne soit marquée comme échec.
l’annulation de Le travail ou la tâche a été annulé et le nettoyage est en cours.
annulé Le travail a été annulé par le propriétaire du travail, un administrateur de cluster ou par le service hpC Job Scheduler. Par exemple, le service HPC Job Scheduler peut annuler un travail s’il dépasse son runtime ou s’il est préempté.

La tâche a été annulée par le propriétaire du travail ou un administrateur de cluster avant de commencer à s’exécuter. Si une tâche en cours d’exécution est annulée, la tâche est marquée comme échec.

Pour annuler un travail ou une tâche, consultez Annuler un travail ou une tâche - Gestionnaire de travaux ou Forcer l’annulation d’un travail ou d’une tâche - Gestionnaire de travaux.

Références supplémentaires