Compartir a través de


Descripción de los estados de trabajo y tareas

En HPC Pack, los trabajos y las tareas tienen estados de ciclo de vida casi idénticos. Los estados principales del ciclo de vida son Configuración de, en cola , en ejecución, Finalizado, Errory cancelada. Los trabajos y las tareas también se mueven a través de estados transitorios breves. En la tabla siguiente se resumen todos los estados del ciclo de vida.

Estados de trabajo y tareas

Estado Definición
Configuración de El trabajo o la tarea está en el sistema, pero no se ha enviado a la cola.
enviado El trabajo o tarea se ha enviado y está esperando la validación antes de que se pueda poner en cola.
Validación de El servicio programador de trabajos de HPC valida el trabajo o la tarea. Durante la validación, el servicio de programador de trabajos de HPC confirma los permisos, aplica la configuración predeterminada para las propiedades que el propietario del trabajo no especificó y valida cada propiedad con restricciones. La plantilla de trabajo define la configuración y las restricciones predeterminadas. Para obtener más información sobre las plantillas de trabajo, vea Descripción de las plantillas de trabajo: administrador de trabajos. El servicio programador de trabajos de HPC también confirma que las propiedades del trabajo abarcan todas las propiedades de la tarea (por ejemplo, ninguna tarea tiene un tiempo de ejecución mayor que el tiempo de ejecución del trabajo).

Durante la validación, el trabajo también puede pasar por una aplicación de filtro de envío personalizada definida por el administrador del clúster.

Si el trabajo pasa la validación, se mueve al estado Queued. Si el trabajo no pasa la validación, el trabajo muestra un mensaje de error y el trabajo se mueve al estado error error.
en cola El trabajo o la tarea pasaron la validación, y está esperando que se programe y active (ejecute).

Cuando un trabajo en ejecución, una tarea de Básico, o una barrido paramétrico subtarea está preemprenda por el servicio programador de trabajos de HPC, vuelve al estado en cola de (a menos que la tarea no se vuelva a ejecutar, en cuyo caso se marca como Failed). Nota: En HPC Pack 2012, la opción predeterminada para el comportamiento de adelantamiento en modo de programación en cola es el adelantamiento inmediato de nivel de tarea, en lugar de adelantamiento de nivel de trabajo.
de distribución Este estado solo se aplica a las tareas. El servicio programador de trabajos de HPC ha asignado recursos a la tarea y está contactando con los nodos asignados para empezar a ejecutar la tarea. Cuando se inicia la tarea, se mueve al estado En ejecución.
en ejecución El trabajo o la tarea se ejecuta en uno o varios nodos.
de acabado El trabajo o la tarea completados, y el trabajo o la limpieza de tareas están en curso.
finalizado El trabajo o la tarea se completaron correctamente.
error El trabajo o la tarea no se pudieron completar, detuvo la ejecución o devolvió códigos de salida que indican un error (de forma predeterminada, cualquier código de salida distinto de cero).

Además, una tarea en ejecución se marca como Error cuando:

- El propietario del trabajo o un administrador del clúster cancela la tarea.
- El servicio programador de trabajos de HPC cancela una tarea porque ha superado el tiempo de ejecución máximo.
- El servicio programador de trabajos de HPC adelanta una tarea que no está marcada como reejecutable.
- El servicio programador de trabajos de HPC adelanta una subtarea que se inicia por recurso (Preparación del nodo, versión de nodoy Service subtareas).

Si un trabajo o una tarea no se inician debido a un error de clúster, el trabajo o la tarea se reintenta automáticamente un número especificado de veces antes de que se marque como Error.
cancelar El trabajo o la tarea se canceló y la limpieza está en curso.
cancelado El propietario del trabajo canceló el trabajo, un administrador del clúster o el servicio de programador de trabajos de HPC. Por ejemplo, el servicio programador de trabajos de HPC puede cancelar un trabajo si supera su tiempo de ejecución o si está adelantado.

El propietario del trabajo o un administrador de clústeres cancelaron la tarea antes de empezar a ejecutarse. Si se cancela una tarea en ejecución, la tarea se marca como Error.

Para cancelar un trabajo o una tarea, consulte Cancelar un trabajo o una tarea: administrador de trabajos o Forzar cancelación de un trabajo o tarea: administrador de trabajos.

Referencias adicionales