Compartir a través de


Definir nodos excluidos para un trabajo

En HPC Pack, si observa que las tareas del trabajo producen un error constante en un nodo determinado, puede excluir ese nodo del trabajo agregándolo a la propiedad de trabajo Nodos excluidos . Al especificar nodos en el Nodos excluidos:

  • Las tareas del trabajo que se ejecutan en un nodo que se ha agregado a nodos excluidos se cancelan y se marcan como Error (con la excepción de tareas de lanzamiento de nodo).

  • tareas de lanzamiento de node se ejecutan en el nodo excluido antes de que se libere el nodo.

  • No se inicia ninguna tarea en los nodos que aparecen en Nodos excluidos.

  • Si las adiciones a la nodos excluidos lista hacen que el trabajo se quite debajo de sus requisitos mínimos de recursos, el trabajo se cancela y se vuelve a poner en cola.

Para cualquier trabajo activo que posea, puede agregar o quitar nodos en la propiedad Nodos excluidos o borrar la lista. A continuación se enumeran los comandos para modificar y ver la lista Nodos excluidos mediante HPC PowerShell o un símbolo del sistema.

En HPC PowerShell, use los siguientes cmdlets:

  • Set-HpcJob –Id <yourJobID> /addExludedNodes <nodeName>, <nodename>

  • Set-HpcJob –Id <yourJobID> /removeExcludedNodes <nodeName>, <nodename>

  • Set-HpcJob –Id <yourJobID> /clearExcludedNodes

  • (Get-HpcJob –Id <yourJobID>).ExcludedNodes

  • O para ver todas las propiedades del trabajo, Get-HpcJob –Id <yourJobID>|fl

En un símbolo del sistema, use los siguientes comandos:

  • job modify <yourJobID> /addExludedNodes:<nodeName>,<nodename>

  • job modify <yourJobID> /removeExcludedNodes:<nodeName>,<nodename>

  • job modify <yourJobID> /clearExcludedNodes

  • job view <yourJobID> /detailed|find “excludednodes” /i

  • O para ver todas las propiedades del trabajo, job view <yourJobID> /detailed

Nota:

En el caso de los trabajos de SOA, el nodo de agente actualiza y mantiene automáticamente la lista de nodos excluidos según el valor de EndPointNotFoundRetryPeriod (en el archivo de configuración del servicio). Esta configuración especifica cuánto tiempo debe reintentar el host de servicio al cargar el servicio y cuánto tiempo debe esperar el agente para una conexión. Si transcurre este tiempo, el agente agrega el nodo (host de servicio) a la lista Nodos excluidos. La configuración del servicio también incluye la configuración de maxExcludedNodes que especifica cuántos nodos se pueden excluir antes de que se produzca un error en la sesión.

Vea también

envío de trabajos en microsoft HPC Pack