Compartir a través de


Descripción de la directiva de disponibilidad de nodo de Azure

La directiva de disponibilidad de nodos de Azure determina cómo y cuándo se inician los nodos de Azure (las instancias de rol se implementan en Azure) y se detienen (las instancias de rol se quitan en Azure).

Tiene las dos opciones siguientes para configurar la disponibilidad de los nodos de Azure:

  • Automático Los nodos se configuran automáticamente para iniciarse (aprovisionarse) y, a continuación, se llevan al estado en línea de durante uno o varios intervalos programados cada semana. Puede especificar varias veces cada semana cuando quiera que los nodos estén disponibles para ejecutar trabajos. Al final de cada bloque de tiempo, los nodos se detienen automáticamente: los nodos se desconectan y se quitan las instancias de rol. Opcionalmente, puede especificar un intervalo de tiempo antes del final de un bloque en línea cuando se purgan los trabajos que se ejecutan en los nodos.

  • Manual Para que los nodos de Azure estén disponibles para ejecutar trabajos, primero debe iniciar manualmente (aprovisionar) los nodos y, a continuación, ponerlos en línea.

Consideraciones adicionales

  • El aprovisionamiento de las instancias de rol de Azure puede tardar varios minutos en algunas condiciones y detener y eliminar las instancias también puede tardar varios minutos.

  • Los nodos están disponibles para ejecutar trabajos en un bloque de tiempo en línea solo después de que las instancias de rol se hayan aprovisionado en Azure. La hora programada para iniciar (y poner en línea) los nodos no incluyen el tiempo que Azure tarda en aprovisionar las instancias de rol.

  • Si se configura una directiva de disponibilidad automática, como procedimiento recomendado, planee durante 60 minutos cada bloque de tiempo en línea para la implementación de nodos, además del tiempo que desea que los nodos estén disponibles para ejecutar trabajos. También debe evitar la programación de bloques de tiempo en línea a intervalos cortos.

  • La edición de la directiva de disponibilidad de nodos de Azure cambia la directiva de los nodos que ya se han agregado al clúster de HPC mediante la plantilla de nodo, así como para los nodos que agregue más adelante. Por ejemplo, puede editar la plantilla de nodo de Azure para que los nodos configurados para iniciar y detenerse automáticamente según una programación semanal ahora estén configurados para iniciar y detener manualmente.

  • En función de la configuración de la directiva de disponibilidad en la plantilla de nodo de Azure y la configuración Período de gracia de cancelación de tareas en Configuración del programador de trabajos, la hora exacta en que se detienen los nodos de Azure y los extremos de implementación pueden diferir del final programado de un bloque de tiempo en línea. Esto puede ocurrir cuando las tareas de HPC siguen ejecutándose cerca del final del bloque de tiempo en línea. Para obtener más información, consulte la sección Interacción de la directiva de disponibilidad con la configuración período de gracia de cancelación de tareas.

Interacción de la directiva de disponibilidad con la configuración Período de gracia de cancelación de tareas

Cuando se configura una directiva de disponibilidad automática, los nodos de Azure no inician trabajos después de que se supere un bloque de tiempo en línea. Sin embargo, las tareas de HPC que todavía se están ejecutando al final de un bloque de tiempo en línea pueden seguir ejecutándose durante un período si se configura la opción Período de gracia de cancelación de tareas. La propiedad clúster Task Cancel Grace Period establece un período de tiempo para que las aplicaciones guarden información de estado y limpien antes de salir (el período predeterminado es de 15 segundos). La hora exacta en que finaliza una tarea depende de si la tarea responde rápidamente al evento CTRL_BREAK (el equivalente de la combinación de teclas CTRL+BREAK). Las tareas que no procesan el evento se cerrarán inmediatamente, mientras que las que realizan el proceso del evento pueden tardar tanto tiempo como el período de gracia de cancelación de la tarea para salir correctamente.

En la tabla siguiente se resume cuándo las tareas de HPC dejarán de ejecutarse como resultado de la interacción entre la directiva de disponibilidad del nodo de Azure y la configuración Período de gracia de cancelación de tareas. Se enumeran posibles impactos y soluciones alternativas. La interacción difiere en función de si se configura un período de "purga" en la directiva de disponibilidad. El período de purga es una configuración opcional que especifica el número de minutos antes del final de un bloque de tiempo en línea durante el cual no se iniciará ninguna nueva tarea en esos nodos.

Período de purga de tareas configurado en la directiva de disponibilidad Cuando comienza el período de gracia de cancelación de tareas Cuando finaliza la ejecución de tareas de HPC Impactos Soluciones alternativas
Comienzo del período de drenaje Entre el principio y el final del período de gracia de cancelación de la tarea, dependiendo de si la tarea sale al recibir la señal, o usa el período de tiempo proporcionado por el período de gracia de cancelación de la tarea. Puede ser antes del bloqueo programado de fin de tiempo en línea.

de ejemplo de

- Bloqueo programado de fin de hora en línea: 8:00 p. m.
- Período de gracia: 5 minutos
- Período de drenaje: 10 minutos

Las tareas en ejecución finalizarán entre las 7:50 y las 7:55 p. m.
- Los nodos de Azure se detienen y la implementación se quita antes de lo esperado.
- Es posible que el uso de recursos de Azure para tareas de HPC no sea óptimo.
- Ajuste el período de gracia de cancelación de la tarea para que sea el mismo que el período de purga, o lo más similar posible.
- Especifique valores pequeños para el período de purga y el período de gracia, si las aplicaciones las permiten.
No Fin del bloque de tiempo en línea configurado Entre el principio y el final del período de gracia de cancelación de la tarea, dependiendo de si la tarea sale al recibir la señal, o usa el período de tiempo proporcionado por el período de gracia de cancelación de la tarea. Puede ser después del bloqueo programado de finalización de la hora en línea.

de ejemplo de

- Bloqueo programado de fin de hora en línea: 8:00 p. m.
- Período de gracia: 5 minutos

Las tareas en ejecución finalizarán entre las 8:00 y las 8:05 p. m.
- Las tareas de HPC pueden continuar ejecutándose más allá del final del bloque de tiempo en línea mientras la tarea cancele el período de gracia.
- La implementación de nodos de Azure se puede extender más allá del final del bloque de tiempo del nodo mientras la tarea cancele el período de gracia.
- Si las aplicaciones lo permiten, ajuste el período de gracia de cancelación de tareas para que sea un valor más pequeño.

Consulte también

Configuración de una plantilla de nodo de Azure para microsoft HPC Pack
Descripción de los estados del nodo, el estado y las operaciones
período de gracia de cancelación de la tarea
Establecer el número de nodos de Proxy de Azure