Descripción de los estados de trabajo y tareas
En HPC Pack, los trabajos y las tareas tienen estados de ciclo de vida casi idénticos. Los estados principales del ciclo de vida son Configuración de, en cola , en ejecución, Finalizado, Errory cancelada. Los trabajos y las tareas también se mueven a través de estados transitorios breves. En la tabla siguiente se resumen todos los estados del ciclo de vida.
Estados de trabajo y tareas
Estado | Definición |
---|---|
Configuración de | El trabajo o la tarea está en el sistema, pero no se ha enviado a la cola. |
enviado | El trabajo o tarea se ha enviado y está esperando la validación antes de que se pueda poner en cola. |
Validación de | El servicio programador de trabajos de HPC valida el trabajo o la tarea. Durante la validación, el servicio de programador de trabajos de HPC confirma los permisos, aplica la configuración predeterminada para las propiedades que el propietario del trabajo no especificó y valida cada propiedad con restricciones. La plantilla de trabajo define la configuración y las restricciones predeterminadas. Para obtener más información sobre las plantillas de trabajo, vea Descripción de las plantillas de trabajo: administrador de trabajos. El servicio programador de trabajos de HPC también confirma que las propiedades del trabajo abarcan todas las propiedades de la tarea (por ejemplo, ninguna tarea tiene un tiempo de ejecución mayor que el tiempo de ejecución del trabajo). Durante la validación, el trabajo también puede pasar por una aplicación de filtro de envío personalizada definida por el administrador del clúster. Si el trabajo pasa la validación, se mueve al estado Queued. Si el trabajo no pasa la validación, el trabajo muestra un mensaje de error y el trabajo se mueve al estado error |
en cola | El trabajo o la tarea pasaron la validación, y está esperando que se programe y active (ejecute). Cuando un trabajo en ejecución, una tarea de |
de distribución | Este estado solo se aplica a las tareas. El servicio programador de trabajos de HPC ha asignado recursos a la tarea y está contactando con los nodos asignados para empezar a ejecutar la tarea. Cuando se inicia la tarea, se mueve al estado En ejecución. |
en ejecución | El trabajo o la tarea se ejecuta en uno o varios nodos. |
de acabado | El trabajo o la tarea completados, y el trabajo o la limpieza de tareas están en curso. |
finalizado | El trabajo o la tarea se completaron correctamente. |
error | El trabajo o la tarea no se pudieron completar, detuvo la ejecución o devolvió códigos de salida que indican un error (de forma predeterminada, cualquier código de salida distinto de cero). Además, una tarea en ejecución se marca como Error cuando: - El propietario del trabajo o un administrador del clúster cancela la tarea. - El servicio programador de trabajos de HPC cancela una tarea porque ha superado el tiempo de ejecución máximo. - El servicio programador de trabajos de HPC adelanta una tarea que no está marcada como reejecutable. - El servicio programador de trabajos de HPC adelanta una subtarea que se inicia por recurso (Preparación del nodo, versión de nodoy Service subtareas). Si un trabajo o una tarea no se inician debido a un error de clúster, el trabajo o la tarea se reintenta automáticamente un número especificado de veces antes de que se marque como Error. |
cancelar | El trabajo o la tarea se canceló y la limpieza está en curso. |
cancelado | El propietario del trabajo canceló el trabajo, un administrador del clúster o el servicio de programador de trabajos de HPC. Por ejemplo, el servicio programador de trabajos de HPC puede cancelar un trabajo si supera su tiempo de ejecución o si está adelantado. El propietario del trabajo o un administrador de clústeres cancelaron la tarea antes de empezar a ejecutarse. Si se cancela una tarea en ejecución, la tarea se marca como Error. Para cancelar un trabajo o una tarea, consulte Cancelar un trabajo o una tarea: administrador de trabajos o Forzar cancelación de un trabajo o tarea: administrador de trabajos. |
Referencias adicionales
Descripción de trabajos y tareas: del Administrador de trabajos
administrar trabajos y tareas: del Administrador de trabajos
realizar un seguimiento del estado del trabajo: del Administrador de trabajos