Partager via


Présentation de la stratégie de disponibilité azure Node

La stratégie de disponibilité des nœuds Azure détermine comment et quand les nœuds Azure sont démarrés (les instances de rôle sont déployées dans Azure) et arrêtées (les instances de rôle sont supprimées dans Azure).

Vous disposez des deux options suivantes pour configurer la disponibilité de vos nœuds Azure :

  • automatique Les nœuds sont automatiquement configurés pour être démarrés (approvisionnés), puis remis à l’état Online pendant un ou plusieurs intervalles planifiés chaque semaine. Vous pouvez spécifier plusieurs fois par semaine lorsque vous souhaitez que les nœuds soient disponibles pour exécuter des travaux. À la fin de chaque bloc de temps, les nœuds sont automatiquement arrêtés : les nœuds sont mis hors connexion et les instances de rôle sont supprimées. Si vous le souhaitez, vous pouvez spécifier un intervalle de temps avant la fin d’un bloc en ligne lorsque les travaux en cours d’exécution sur les nœuds sont vidés.

  • manuel Pour rendre les nœuds Azure disponibles pour exécuter des travaux, vous devez d’abord démarrer (provisionner) manuellement les nœuds, puis les mettre en ligne.

Considérations supplémentaires

  • L’approvisionnement des instances de rôle Azure peut prendre plusieurs minutes dans certaines conditions, et l’arrêt et la suppression des instances peuvent également prendre plusieurs minutes.

  • Les nœuds sont disponibles pour exécuter des travaux dans un bloc de temps en ligne uniquement après l’approvisionnement des instances de rôle dans Azure. L’heure planifiée pour démarrer (et mettre en ligne) les nœuds n’incluent pas le temps nécessaire à l’approvisionnement des instances de rôle par Azure.

  • Si une stratégie de disponibilité automatique est configurée, comme bonne pratique, planifiez 60 minutes dans chaque bloc de temps en ligne pour le déploiement de nœuds, en plus de l’heure à laquelle vous souhaitez que les nœuds soient disponibles pour exécuter des travaux. Vous devez également éviter de planifier des blocs de temps en ligne à intervalles courts.

  • La modification de la stratégie de disponibilité des nœuds Azure modifie la stratégie pour les nœuds qui sont déjà ajoutés au cluster HPC à l’aide du modèle de nœud, ainsi que pour les nœuds que vous ajoutez ultérieurement. Par exemple, vous pouvez modifier le modèle de nœud Azure afin que les nœuds configurés pour démarrer et s’arrêter automatiquement en fonction d’une planification hebdomadaire soient maintenant configurés pour démarrer et arrêter manuellement.

  • En fonction de la configuration de la stratégie de disponibilité dans le modèle de nœud Azure et du paramètre De période d’annulation de la tâche dans la configuration du planificateur de travaux, l’heure exacte à laquelle les nœuds Azure sont arrêtés et les fins de déploiement peuvent différer de la fin planifiée d’un bloc de temps en ligne. Cela peut se produire lorsque les tâches HPC s’exécutent toujours près de la fin du bloc de temps en ligne. Pour plus d’informations, consultez la section Interaction de la stratégie de disponibilité avec le paramètre Annuler la période de grâce de la tâche.

Interaction de la stratégie de disponibilité avec le paramètre Annuler la période de grâce de la tâche

Lorsqu’une stratégie de disponibilité automatique est configurée, les nœuds Azure ne démarrent pas les travaux après qu’un bloc de temps en ligne passe. Toutefois, les tâches HPC qui s’exécutent toujours à la fin d’un bloc de temps en ligne peuvent continuer à s’exécuter pendant une période si le paramètre Annuler la période de grâce de la tâche est configuré. La propriété du cluster Annuler la période de grâce définit une période de temps pour que les applications enregistrent les informations d’état et nettoient avant de quitter (la période par défaut est de 15 secondes). L’heure exacte à laquelle une tâche se termine dépend de la rapidité et de la rapidité avec laquelle la tâche répond à l’événement CTRL_BREAK (l’équivalent de la combinaison de touches Ctrl+Break). Les tâches qui ne traitent pas l’événement se terminent immédiatement, tandis que celles qui traitent l’événement peuvent prendre autant de temps que la période d’annulation de la tâche annuler la période de grâce s’arrête correctement.

Le tableau suivant récapitule quand les tâches HPC cesseront de s’exécuter suite à l’interaction entre la stratégie de disponibilité du nœud Azure et le paramètre Annuler la période de grâce de la tâche. Les impacts possibles et les solutions de contournement sont répertoriés. L’interaction diffère selon qu’une période de « drainage » est configurée dans la stratégie de disponibilité. La période de drainage est un paramètre facultatif qui spécifie le nombre de minutes avant la fin d’un bloc de temps en ligne pendant lequel aucune nouvelle tâche ne démarre sur ces nœuds.

Période de drainage des tâches configurée dans la stratégie de disponibilité Lorsque la tâche annule la période de grâce commence Lors de l’exécution de tâches HPC terminées Impacts Solutions de contournement
Oui Début de la période de drainage Entre le début et la fin de la période de grâce d’annulation de la tâche, selon que la tâche se termine lors de la réception du signal ou utilise la période de temps fournie par la période de grâce d’annulation de la tâche. Peut être avant la fin planifiée du bloc de temps en ligne.

exemple de

- Fin planifiée du bloc de temps en ligne : 18h00
- Période de grâce : 5 minutes
- Période de drainage : 10 min

Les tâches en cours d’exécution se terminent entre 17 h 50 et 17 h 55
- Les nœuds Azure sont arrêtés et le déploiement est arrêté plus tôt que prévu.
- L’utilisation des ressources Azure pour les tâches HPC peut ne pas être optimale.
- Ajustez la période de grâce d’annulation de la tâche de la même façon que possible, ou de la même façon que possible.
- Spécifiez de petites valeurs pour la période de drainage et la période de grâce, si vos applications les autorisent.
Non Fin du bloc de temps en ligne configuré Entre le début et la fin de la période de grâce d’annulation de la tâche, selon que la tâche se termine lors de la réception du signal ou utilise la période de temps fournie par la période de grâce d’annulation de la tâche. Peut être après la fin planifiée du bloc de temps en ligne.

exemple de

- Fin planifiée du bloc de temps en ligne : 18h00
- Période de grâce : 5 minutes

Les tâches en cours d’exécution se terminent entre 8h00 et 18h05
- Les tâches HPC peuvent continuer à s’exécuter au-delà de la fin du bloc de temps en ligne tant que la période d’annulation de la tâche annule la période de grâce.
- Le déploiement de nœuds Azure peut être étendu au-delà de la fin du bloc de temps du nœud tant que la tâche annule la période de grâce.
- Si vos applications l’autorisent, ajustez la période d’annulation de grâce de la tâche pour qu’elle soit plus petite.

Voir aussi

configuration d’un modèle de nœud Azure pour Microsoft HPC Pack
Présentation des états des nœuds, de l’intégrité et des opérations
tâche annuler la période de grâce
définir le nombre de nœuds proxy Azure