Informazioni sui criteri di disponibilità dei nodi di Azure
I criteri di disponibilità dei nodi di Azure determinano come e quando vengono avviati i nodi di Azure (le istanze del ruolo vengono distribuite in Azure) e arrestate (le istanze del ruolo vengono rimosse in Azure).
Sono disponibili le due opzioni seguenti per configurare la disponibilità per i nodi di Azure:
automatica I nodi vengono configurati automaticamente per l'avvio (provisioning) e quindi vengono portati allo stato online durante uno o più intervalli pianificati ogni settimana. È possibile specificare più volte ogni settimana quando si desidera che i nodi siano disponibili per l'esecuzione dei processi. Alla fine di ogni blocco temporale, i nodi vengono arrestati automaticamente: i nodi vengono portati offline e le istanze del ruolo vengono rimosse. Facoltativamente, è possibile specificare un intervallo di tempo prima della fine di un blocco online quando tutti i processi in esecuzione sui nodi vengono svuotati. Manuale Per rendere disponibili i nodi di Azure per l'esecuzione dei processi, è prima necessario avviare manualmente (effettuare il provisioning) dei nodi e quindi portarli online.
Considerazioni aggiuntive
Il provisioning delle istanze del ruolo di Azure può richiedere alcuni minuti in alcune condizioni e l'arresto e l'eliminazione delle istanze possono richiedere anche alcuni minuti.
I nodi sono disponibili per l'esecuzione di processi in un blocco di tempo online solo dopo il provisioning delle istanze del ruolo in Azure. L'ora pianificata per l'avvio (e portare online) i nodi non includono il tempo impiegato da Azure per effettuare il provisioning delle istanze del ruolo.
Se un criterio di disponibilità automatica è configurato, come procedura consigliata, pianificare 60 minuti in ogni blocco di tempo online per la distribuzione dei nodi, oltre al tempo in cui si desidera che i nodi siano disponibili per l'esecuzione dei processi. È anche consigliabile evitare di pianificare blocchi di tempo online a intervalli brevi.
La modifica dei criteri di disponibilità dei nodi di Azure modifica i criteri per i nodi già aggiunti al cluster HPC usando il modello di nodo, nonché per i nodi aggiunti in un secondo momento. Ad esempio, è possibile modificare il modello di nodo di Azure in modo che i nodi configurati per l'avvio e l'arresto automatici in base a una pianificazione settimanale siano ora configurati per l'avvio e l'arresto manuale.
A seconda della configurazione dei criteri di disponibilità nel modello di nodo di Azure e dell'impostazione Periodo di tolleranza di annullamento attività in Configurazione dell'utilità di pianificazione, l'ora esatta in cui i nodi di Azure vengono arrestati e la distribuzione termina può differire dalla fine pianificata di un blocco di tempo online. Ciò può verificarsi quando le attività HPC sono ancora in esecuzione vicino alla fine del blocco di tempo online. Per altre informazioni, vedere la sezione Interazione dei criteri di disponibilità con l'impostazione Periodo di tolleranza di annullamento attività.
Interazione dei criteri di disponibilità con l'impostazione Periodo di tolleranza annullamento attività
Quando viene configurato un criterio di disponibilità automatica, i nodi di Azure non avviano i processi dopo il passaggio di un blocco di tempo online. Tuttavia, le attività HPC ancora in esecuzione alla fine di un blocco di tempo online possono continuare a essere eseguite per un periodo se l'impostazione Periodo di tolleranza di annullamento attività è configurata. La proprietà cluster Task Cancel Grace Period imposta un periodo di tempo per le applicazioni per salvare le informazioni sullo stato e pulire prima dell'uscita (il periodo predefinito è 15 secondi). L'ora esatta in cui un'attività termina dipende dal fatto che e dalla velocità di risposta dell'attività all'evento CTRL_BREAK (equivalente alla combinazione di tasti CTRL+INTERR). Le attività che non elaborano l'evento verranno chiuse immediatamente, mentre quelle che elaborano l'evento possono richiedere fino a quando il periodo di tolleranza di annullamento attività viene chiuso normalmente.
La tabella seguente riepiloga quando le attività HPC smetteranno di essere eseguite in seguito all'interazione tra i criteri di disponibilità dei nodi di Azure e l'impostazione Task Cancel Grace Period .The following table summarizes when HPC tasks will stop running as a result of the interaction between the Azure node availability policy and the Task Cancel Grace Period setting. Sono elencati possibili effetti e soluzioni alternative. L'interazione varia a seconda che nel criterio di disponibilità sia configurato un periodo di "svuotamento". Il periodo di svuotamento è un'impostazione facoltativa che specifica il numero di minuti prima della fine di un blocco di tempo online durante il quale non verranno avviate nuove attività su tali nodi.
Periodo di svuotamento delle attività configurato nei criteri di disponibilità | Quando inizia il periodo di tolleranza di annullamento attività | Quando si eseguono attività HPC terminano | Impatti | Soluzioni alternative |
---|---|---|---|---|
Sì | Inizio del periodo di scarico | Tra l'inizio e la fine del periodo di tolleranza di annullamento attività, a seconda che l'attività venga chiusa al momento della ricezione del segnale o usi il periodo di tempo fornito dal periodo di tolleranza di annullamento attività. Può essere prima della fine pianificata del blocco di tempo online. esempio di - Fine pianificata del blocco di tempo online: 18:00 - Periodo di tolleranza: 5 minuti - Periodo di scarico: 10 min L'esecuzione delle attività terminerà tra le 17:50 e le 17:55 |
- I nodi di Azure vengono arrestati e la distribuzione viene arrestata prima del previsto. - L'utilizzo delle risorse di Azure per le attività HPC potrebbe non essere ottimale. |
- Regolare il periodo di tolleranza dell'annullamento dell'attività in modo che corrisponda al periodo di svuotamento o il più simile possibile. - Specificare valori piccoli per il periodo di svuotamento e il periodo di tolleranza, se le applicazioni le consentono. |
No | Fine del blocco di tempo online configurato | Tra l'inizio e la fine del periodo di tolleranza di annullamento attività, a seconda che l'attività venga chiusa al momento della ricezione del segnale o usi il periodo di tempo fornito dal periodo di tolleranza di annullamento attività. Può essere dopo la fine pianificata del blocco di tempo online. esempio di - Fine pianificata del blocco di tempo online: 18:00 - Periodo di tolleranza: 5 minuti L'esecuzione delle attività terminerà tra le 8:00 e le 18:05 |
- Le attività HPC possono continuare a essere eseguite oltre la fine del blocco di tempo online fino a quando il periodo di tolleranza di annullamento attività. - La distribuzione dei nodi di Azure può essere estesa oltre la fine del blocco di tempo del nodo fino a quando il periodo di tolleranza di annullamento dell'attività. |
- Se le applicazioni lo consentono, modificare il periodo di tolleranza di annullamento attività in modo che sia un valore inferiore. |
Vedere anche
Configurazione di un modello di nodo di Azure per Microsoft HPC Pack
Informazioni sugli stati dei nodi, sull'integrità e sulle operazioni
periodo di tolleranza di annullamento dell'attività
Impostare il numero di nodi proxy di Azure