Compartir a través de


Descripción de la configuración de directivas

La configuración de directiva controla cómo se asignan los recursos a los trabajos en cola o en ejecución. La modo de programación de le permite optimizar la asignación de recursos para cargas de trabajo por lotes y MPI grandes o para cargas de trabajo de servicio. Para obtener información sobre cómo cambiar las opciones de configuración, consulte Configure the HPC Job Scheduler Service.

En la tabla siguiente se resumen los dos modos de programación y sus configuraciones predeterminadas:

Cola Equilibrado
descripción Inicie los trabajos en orden de cola e intente asignar el máximo de recursos solicitados a los trabajos en ejecución.

- Finalice los trabajos de prioridad más alta lo antes posible.
- Intento de dar a los trabajos sus recursos máximos solicitados
- Minimizar el tiempo de ejecución del trabajo
- Espera más larga en la cola de trabajos para trabajos de prioridad inferior
- Los recursos disponibles se usan primero para satisfacer la solicitud de recursos máxima de los trabajos en ejecución y, a continuación, para iniciar nuevos trabajos (cuando la asignación de recursos adaptable (crecido o reducir) está habilitada).
Intente iniciar todos los trabajos entrantes lo antes posible en sus requisitos mínimos de recursos. Si hay recursos adicionales disponibles, aumente los trabajos en función de la prioridad.

- Inicie todos los trabajos entrantes lo antes posible.
- Empiece por proporcionar a los trabajos sus recursos mínimos y, a continuación, agregue recursos, si es posible, equilibrando en función de la prioridad y los recursos solicitados.
- Minimizar el tiempo de espera en la cola de trabajos
- Los trabajos tardan más tiempo en completarse.
- Los recursos se pueden tomar de los trabajos en ejecución para iniciar nuevos trabajos, incluso si la ejecución tiene una prioridad más alta.
optimizado para - Trabajos de MPI y lotes grandes
- Tareas de larga duración
- Barridos paramétricos
- Cargas de trabajo interactivas, como trabajos de arquitectura orientada a servicios (SOA) y aplicaciones de tipo de servicio
- Tareas de ejecución corta
- Barridos paramétricos
configuración adicional - de adelantamiento
Valor predeterminado: adelantamiento con gracia
- asignación de recursos adaptables (aumentar o reducir)
Valor predeterminado: aumentar y disminuir los recursos automáticamente habilitados

Consulte configuración del modo en cola en este tema.
- de adelantamiento
Valor predeterminado: la de adelantamiento inmediato: configuración de adelantamiento solo se puede configurar en modo equilibrado a partir de HPC Pack 2012 con Service Pack 1 (SP1). En versiones anteriores, en modo equilibrado, el adelantamiento siempre es Inmediato.
de sesgo de prioridad de
Valor predeterminado: sesgo medio
- intervalo de reequilibrio
Valor predeterminado: 10 segundos

Consulte configuración del modo equilibrado en este tema.

Configuración del modo en cola

En modo en cola, el servicio programador de trabajos de HPC inicia trabajos en orden de cola e intenta asignar el máximo de recursos solicitados a los trabajos en ejecución. En las secciones siguientes se describen la configuración de asignación de recursos adaptable y de asignación de recursos adaptables asociadas al modo en cola.

Adelantamiento del trabajo

El adelantamiento permite que los trabajos de mayor prioridad que esperan en la cola empiecen antes al quitar los recursos de prioridad inferior, los trabajos de que ya están en ejecución. Si habilita la directiva de Aumentar por adelantamiento (consulte "Asignación de recursos adaptables" a continuación), también se usará el adelantamiento para ayudar a aumentar la prioridad, ejecutar trabajos a su solicitud de recursos máxima (disponible a partir de HPC Pack 2008 R2 con Service Pack 2 (SP2).

Nota

El administrador define la propiedad de trabajo preemptable en las plantillas de trabajo. Use plantillas de trabajo para definir los tipos de trabajos que se pueden adelantar o los conjuntos de usuarios que pueden enviar trabajos preemptibles o no preferentes. preemptable no se puede definir al enviar un trabajo a través del Administrador de clústeres de HPC, el Administrador de trabajos de HPC, powerShell de HPC o las herramientas de línea de comandos de HPC. Solo es posible hacerlo mediante la API de HPC, si la plantilla de trabajo seleccionada especifica True y False como valores válidos para la propiedad de trabajo Preemptable.

El adelantamiento en modo en cola tiene las siguientes opciones:

  • de adelantamiento correcto (valor predeterminado): tome los recursos del trabajo a medida que se completen sus tareas en ejecución para que no se pierda el trabajo.

  • adelantamiento inmediato: tome los recursos del trabajo adelantado cancelando todas las tareas en ejecución para que los recursos se puedan asignar inmediatamente al trabajo de prioridad alta. Para obtener más información sobre la cancelación de trabajos y tareas, vea la sección Consideraciones adicionales en Cancelar un trabajo o tarea.

  • de adelantamiento de nivel de tarea (introducido en HPC Pack 2008 R2 con SP3): Habilite el adelantamiento de tareas individuales en lugar de trabajos completos. Con la configuración predeterminada de adelantamiento inmediato, el programador cancelará todo un trabajo si se necesita alguno de sus recursos para un trabajo de mayor prioridad. Al habilitar el adelantamiento de nivel de tarea, el programador cancelará las tareas individuales en su lugar. Por ejemplo, si un trabajo de prioridad normal ejecuta 100 tareas en 1 núcleo y se envía un trabajo de prioridad alta que requiere 10 núcleos, el adelantamiento de nivel de tarea cancelará 10 tareas, en lugar de cancelar todo el trabajo. Esta opción puede mejorar el rendimiento del trabajo minimizando la cantidad de reprocesos que se deben realizar debido al adelantamiento.

    Nota

    A partir de HPC Pack 2012, en modo de programación en cola, la opción predeterminada para el comportamiento de adelantamiento es el adelantamiento inmediato de nivel de tarea, en lugar de adelantamiento de nivel de trabajo. Este comportamiento predeterminado significa que solo se adelanten tantas tareas de trabajos de prioridad baja como sean necesarias para proporcionar los recursos necesarios para los trabajos de mayor prioridad, en lugar de adelantar todas las tareas de los trabajos de prioridad baja.

    Nota

    A partir de HPC Pack 2012 con Service Pack 1 (SP1), un trabajo de arquitectura orientada a servicios (SOA) finalizará las tareas una vez finalizada la solicitud actual, incluso si hay solicitudes adicionales que se van a calcular. En versiones anteriores de HPC Pack, un trabajo de SOA finalizará sus tareas para liberar recursos para otro trabajo solo después de que se calculen todas las solicitudes.

  • no hayde adelantamiento: no adelante trabajos.

Asignación de recursos adaptables

La asignación de recursos adaptable ajusta dinámicamente los recursos asignados a un trabajo en función de sus tareas. La habilitación de los ajustes de recursos puede dar lugar a una mejora significativa del uso del clúster y a tiempos de cola de trabajos reducidos, especialmente para los clústeres que ejecutan trabajos compuestos por varias tareas, como cálculos de barrido paramétricos. Solo los trabajos que contienen más de una tarea o subtarea pueden beneficiarse del ajuste automático de recursos.

La asignación adaptable tiene la siguiente configuración que se puede habilitar o deshabilitar:

  • Aumentar los recursos automáticamente (habilitado de forma predeterminada): use los recursos disponibles para aumentar la prioridad, ejecutando trabajos hasta su máximo antes de iniciar trabajos de prioridad inferior. Con el crecimiento automático habilitado, el servicio programador de trabajos de HPC puede asignar recursos gratuitos a trabajos en ejecución que tengan tareas adicionales para ejecutarse. El servicio no asignará más recursos que el máximo solicitado para el trabajo. Esto da como resultado que los trabajos pasan más tiempo en la cola en espera de recursos, pero finalizan más rápidamente después de que se inicien. Los recursos disponibles se asignan primero al trabajo de mayor prioridad en el sistema, tanto si este trabajo se está ejecutando como en cola.

    • aumentar por de adelantamiento (introducido en HPC Pack 2008 R2 con SP2): para ayudar a aumentar la prioridad de los trabajos en ejecución a su máximo, use el adelantamiento para quitar recursos de prioridad inferior y ejecutar trabajos. El adelantamiento debe estar habilitado para usar esta configuración.
  • Reducir recursos automáticamente (habilitado de forma predeterminada): con la reducción automática habilitada, el servicio programador de trabajos de HPC puede liberar recursos no utilizados de trabajos en ejecución que no tengan tareas adicionales para ejecutarse. El servicio no reducirá los recursos por debajo del mínimo solicitado para el trabajo. La reducción automática da como resultado un mejor uso general del clúster, pero puede causar problemas si agrega tareas a trabajos que ya están en curso.

Nota

En la plantilla de trabajo predeterminada, las propiedades del trabajo Calcular automáticamente máximo y Calcular automáticamente minimom se establecen en un valor predeterminado de True. Si una plantilla de trabajo especifica que True es el único valor válido para estas propiedades, el usuario remitente no tendrá la opción de especificar los recursos máximos y mínimos para un trabajo enviado con esa plantilla, y los recursos se calcularán automáticamente en función de las tareas del trabajo.

Configuración del modo equilibrado

En modo equilibrado, el servicio programador de trabajos de HPC intenta iniciar todos los trabajos entrantes lo antes posible en sus requisitos mínimos de recursos. Después de que todos los trabajos de la cola tengan sus recursos mínimos, los recursos de clúster adicionales se asignan a los trabajos en función de su prioridad. La asignación de recursos se vuelve a equilibrar periódicamente para rellenar los recursos inactivos, iniciar nuevos trabajos y ajustar la asignación según la configuración de sesgo de prioridad de . En las secciones siguientes se describe la configuración asociada al modo equilibrado.

Nota

  • La programación equilibrada se limita en situaciones en las que los grupos de nodos se superponen. El modo equilibrado es más eficaz en grupos de nodos no superpuestos.
  • Si especifica que un trabajo debe ejecutarse en un solo nodo (disponible a partir de HPC Pack 2012), el equilibrio realizado por el servicio programador de trabajos de HPC puede estar limitado por otros trabajos que se ejecutan en el clúster.

Adelantamiento del trabajo

El adelantamiento en modo equilibrado permite que los trabajos que esperan en la cola comiencen antes al quitar recursos de trabajos preemptibles que ya están en ejecución.

Importante

Un administrador de HPC solo puede configurar las opciones de adelantamiento en modo equilibrado a partir de HPC Pack 2012 con Service Pack 1 (SP1). En versiones anteriores de HPC Pack, el adelantamiento en modo equilibrado siempre es Inmediato.

Nota

El administrador define la propiedad de trabajo preemptable en las plantillas de trabajo. Use plantillas de trabajo para definir los tipos de trabajos que se pueden adelantar o los conjuntos de usuarios que pueden enviar trabajos preemptibles o no preferentes. preemptable no se puede definir al enviar un trabajo a través del Administrador de clústeres de HPC, el Administrador de trabajos de HPC, powerShell de HPC o las herramientas de línea de comandos de HPC. Solo es posible hacerlo mediante la API de HPC, si la plantilla de trabajo seleccionada especifica True y False como valores válidos para la propiedad de trabajo Preemptable. (El valor predeterminado es True).

El adelantamiento en modo equilibrado tiene las siguientes opciones:

  • adelantamiento inmediato (valor predeterminado): quite los recursos del trabajo adelantado cancelando y requeuando las tareas en ejecución suficientes para que los recursos se puedan asignar a otro trabajo inmediatamente. En la mayoría de las cargas de trabajo de clúster, el adelantamiento inmediato en modo equilibrado permite que más trabajos se inicien en un período de tiempo determinado. Por ese motivo, se recomienda en la mayoría de los casos lograr una programación equilibrada.

  • adelantamiento correcto: tome los recursos del trabajo adelantado a medida que se completen sus tareas en ejecución para que no se pierda el trabajo. Se trata de una configuración avanzada que solo se debe habilitar para cargas de trabajo específicas. Por ejemplo, se puede considerar al usar el modo equilibrado con trabajos de arquitectura orientada a servicios (SOA) que constan de tareas de larga duración, donde es fundamental mantener los resultados afinados por cada tarea intermedia.

    Cautela

    El adelantamiento correcto en modo equilibrado puede ralentizar el tiempo de respuesta de iniciar un nuevo trabajo y puede reducir la velocidad de equilibrio. El clúster debe probarse y supervisarse cuidadosamente cuando el adelantamiento con gracia en modo equilibrado está habilitado. Para obtener más información, consulte las siguientes consideraciones adicionales.

Consideraciones adicionales para el adelantamiento en modo equilibrado

  • velocidad de equilibrio modo equilibrado intenta equilibrar los trabajos lo antes posible, usando el adelantamiento inmediato de forma predeterminada. Si decide habilitar el adelantamiento estable en modo equilibrado, el equilibrio solo puede tener lugar a la velocidad a la que se cierran las tareas. Si hay tareas de ejecución prolongada en el clúster, el equilibrio puede tardar mucho tiempo. Si la tasa de trabajos entrantes supera la tasa de las tareas de salida, el clúster solo equilibrará cuando las tareas suficientes hayan salido para reasignar los recursos.

  • Uso de recursos De forma predeterminada en modo equilibrado, el servicio programador de trabajos de HPC adelanta inmediatamente las tareas para liberar los recursos (como núcleos, nodos o sockets) necesarios para cualquier trabajo en espera. Sin embargo, si el adelantamiento correcto está habilitado, los recursos se liberan a medida que se cierran las tareas, independientemente de los requisitos de recursos de un trabajo en espera. Es posible que los recursos liberados no sean los necesarios para el siguiente trabajo en espera, y los recursos pueden permanecer inactivos hasta que finalicen otras tareas.

Sesgo de prioridad

Prioridad controla cómo se asignan recursos adicionales a los trabajos. En el modo equilibrado, "recursos adicionales" hace referencia al recurso de clúster por encima de los recursos mínimos totales para todos los trabajos en ejecución. Las tareas que se ejecutan en recursos adicionales se pueden cancelar con el adelantamiento inmediato para dar cabida a nuevos trabajos o para converger en el patrón de asignación deseado.

de sesgo de prioridad tiene las siguientes opciones:

  • de sesgo alto: todos los recursos adicionales se asignan a trabajos de mayor prioridad.

  • de sesgo medio (valor predeterminado): cada banda de prioridad se da una proporción mayor de recursos adicionales que la banda debajo. Las bandas de prioridad son más alta, por encima delnormal , normal, por debajo delnormal y más bajo .

  • Sin sesgo: los recursos adicionales se asignan de forma equitativa en la cola de trabajos.

Intervalo de reequilibrio

El intervalo de reequilibrio representa el tiempo, en segundos, entre los pasos de reequilibrio. El valor predeterminado es de 10 segundos.

Un intervalo más largo puede mejorar el rendimiento del programador, pero puede tardar más tiempo en responder a nuevos trabajos y converger en el patrón de asignación deseado. Los intervalos más largos son buenos si no necesita crecimiento instantáneo y reducción. Si el clúster tiene una tasa de solución alternativa alta (los trabajos se envían con frecuencia y finalizan rápidamente), es posible que desee un intervalo más largo para evitar un crecimiento excesivo y la reducción.

Un intervalo de reequilibrio más corto proporciona una respuesta más rápida cuando se envían nuevos trabajos, a costa de una carga adicional en el nodo principal. La otra configuración que puede ajustar si necesita respuestas más rápidas son el período de gracia de cancelación de la tarea y el tiempo de espera de la tarea de lanzamiento, lo que puede hacer que tarde más tiempo en ejecutar el trabajo para que se inserte fuera del camino.

Referencias adicionales