Présentation des états du travail et des tâches
Dans HPC Pack, les travaux et les tâches ont des états de cycle de vie presque identiques. Les états principaux du cycle de vie sont Configuration de, mis en file d’attente, exécution, terminé, échec et annulé. Les travaux et les tâches passent également par des états transitionnels brefs. Le tableau suivant récapitule tous les états de cycle de vie.
États du travail et de la tâche
État | Définition |
---|---|
configuration de | Le travail ou la tâche se trouve dans le système, mais n’a pas été soumis à la file d’attente. |
soumis | Le travail ou la tâche a été envoyé et attend la validation avant de pouvoir être mis en file d’attente. |
validation des | Le service planificateur de travaux HPC valide le travail ou la tâche. Pendant la validation, le service HPC Job Scheduler confirme les autorisations, applique les paramètres par défaut pour toutes les propriétés que le propriétaire du travail n’a pas spécifiées et valide chaque propriété par rapport aux contraintes. Les paramètres et contraintes par défaut sont définis par le modèle de travail. Pour plus d’informations sur les modèles de travail, consultez Understanding Job Templates - Job Manager. Le service HPC Job Scheduler confirme également que les propriétés du travail englobent toutes les propriétés de tâche (par exemple, aucune tâche n’a une durée d’exécution supérieure à l’heure d’exécution du travail). Pendant la validation, le travail peut également passer par une application de filtre de soumission personnalisée définie par l’administrateur du cluster. Si le travail réussit la validation, il passe à l’état mis en file d’attente. Si le travail ne passe pas la validation, le travail affiche un message d’erreur et le travail passe à l’état Échec. |
en file d’attente | Le travail ou la tâche a passé la validation et attend d’être planifié et activé (exécution). Lors d’un travail en cours d’exécution, une tâche |
dispatching | Cet état s’applique uniquement aux tâches. Le service hpC Job Scheduler a alloué des ressources à la tâche et contacte les nœuds alloués pour commencer à exécuter la tâche. Au démarrage de la tâche, elle passe à l’état En cours d’exécution. |
en cours d’exécution | Le travail ou la tâche s’exécute sur un ou plusieurs nœuds. |
finition | Le travail ou la tâche terminée, et le nettoyage de tâche ou de tâche est en cours. |
terminé | Le travail ou la tâche s’est terminé avec succès. |
échec | Le travail ou la tâche n’a pas pu s’exécuter, s’est arrêté ou retourné un code de sortie qui indique l’échec (par défaut, tout code de sortie différent de zéro). En outre, une tâche en cours d’exécution est marquée comme échec quand : - Le propriétaire du travail ou un administrateur de cluster annule la tâche. - Le service hpC Job Scheduler annule une tâche, car elle a dépassé son runtime maximal. - Le service du planificateur de travaux HPC préempt une tâche qui n’est pas marquée comme réexécuter. - Le service du planificateur de travaux HPC préempt une sous-tâche démarrée par ressource ( Si un travail ou une tâche ne parvient pas à démarrer en raison d’un échec de cluster, le travail ou la tâche est automatiquement retenté plusieurs fois avant qu’elle ne soit marquée comme échec. |
l’annulation de | Le travail ou la tâche a été annulé et le nettoyage est en cours. |
annulé | Le travail a été annulé par le propriétaire du travail, un administrateur de cluster ou par le service hpC Job Scheduler. Par exemple, le service HPC Job Scheduler peut annuler un travail s’il dépasse son runtime ou s’il est préempté. La tâche a été annulée par le propriétaire du travail ou un administrateur de cluster avant de commencer à s’exécuter. Si une tâche en cours d’exécution est annulée, la tâche est marquée comme échec. Pour annuler un travail ou une tâche, consultez Annuler un travail ou une tâche - Gestionnaire de travaux ou Forcer l’annulation d’un travail ou d’une tâche - Gestionnaire de travaux. |