Condividi tramite


Informazioni sulla configurazione dei criteri

Le impostazioni di configurazione dei criteri controllano la modalità di allocazione delle risorse ai processi in coda o in esecuzione. La modalità di pianificazione consente di ottimizzare l'allocazione delle risorse per carichi di lavoro MPI e batch di grandi dimensioni o per i carichi di lavoro del servizio. Per informazioni su come modificare le opzioni di configurazione, vedere Configure the HPC Job Scheduler Service.

La tabella seguente riepiloga le due modalità di pianificazione e le relative configurazioni predefinite:

Accodati Bilanciato
Descrizione Avviare i processi in ordine di coda e tentare di allocare le risorse massime richieste ai processi in esecuzione.

- Completare i processi con priorità più alta il prima possibile
- Tentativo di assegnare ai processi il numero massimo di risorse richieste
- Ridurre al minimo il tempo di esecuzione del processo
- Attesa più lunga nella coda dei processi per i processi con priorità più bassa
- Le risorse disponibili vengono usate per soddisfare la richiesta massima di risorse dei processi in esecuzione e quindi per avviare nuovi processi (quando è abilitata l'allocazione adattiva delle risorse (aumento/compattazione)
Tentare di avviare tutti i processi in ingresso il prima possibile con i requisiti minimi delle risorse. Se sono disponibili risorse aggiuntive, aumentare i processi in base alla priorità.

- Avviare tutti i processi in ingresso il prima possibile
- Iniziare assegnando le risorse minime ai processi e quindi aggiungendo le risorse, se possibile, bilanciando in base alla priorità e alle risorse richieste
- Ridurre al minimo il tempo di attesa nella coda del processo
- Il completamento dei processi richiede più tempo
- Le risorse possono essere ricavate dall'esecuzione di processi per avviare nuovi processi, anche se l'esecuzione ha una priorità più alta
Ottimizzata per - Processi MPI e batch di grandi dimensioni
- Attività a esecuzione prolungata
- Sweep parametrici
- Carichi di lavoro interattivi, ad esempio processi SOA (Service-Oriented Architecture) e applicazioni di tipo servizio
- Attività a esecuzione breve
- Sweep parametrici
Impostazioni aggiuntive - di preemption
Impostazione predefinita: preemption normale
- 'allocazione di risorse adattiva (aumento/compattazione)
Impostazione predefinita: aumentare e ridurre automaticamente le risorse abilitate

Vedere impostazioni della modalità in coda in questo argomento.
- di preemption
Impostazione predefinita: la precedenza immediata Nota: impostazioni di preemption possono essere configurate solo in modalità bilanciata a partire da HPC Pack 2012 con Service Pack 1 (SP1). Nelle versioni precedenti, in modalità bilanciata, la precedenza è sempre Immediata.
- di distorsione priorità
Impostazione predefinita: Distorsione media
- intervallo di ribilanciamento
Impostazione predefinita: 10 secondi

Vedere impostazioni della modalità bilanciata in questo argomento.

Impostazioni della modalità in coda

In modalità in coda, il servizio utilità di pianificazione processi HPC avvia i processi in ordine di coda e tenta di allocare le risorse massime richieste ai processi in esecuzione. Le sezioni seguenti descrivono le impostazioni di allocazione delle risorse adattive e di preemption associate alla modalità in coda.

Precedenza del processo

La precedenza consente ai processi con priorità più alta in attesa di iniziare prima nella coda eliminando le risorse dalla priorità più bassa, i processi che sono già in esecuzione. Se si abilita il criterio Grow by preemption (vedere "Allocazione risorse adattiva" di seguito), verrà usata anche la precedenza per aumentare la priorità, eseguendo processi alla richiesta di risorsa massima (disponibile a partire da HPC Pack 2008 R2 con Service Pack 2 (SP2).

Nota

La proprietà processo preemptable è definita dall'amministratore nei modelli di processo. Usare i modelli di processo per definire i tipi di processi che possono essere annullati o i set di utenti che possono inviare processi non superati o non superati. non è possibile definire preemptable quando si invia un processo tramite HPC Cluster Manager, HPC Job Manager, HPC PowerShell o gli strumenti da riga di comando HPC. È possibile eseguire questa operazione solo usando l'API HPC, se il modello di processo selezionato specifica sia True che False come valori validi per la proprietà del processo Preemptable.

La precedenza in modalità in coda include le opzioni seguenti:

  • normale di precedenza (impostazione predefinita): eseguire le risorse dal processo non superato man mano che le attività in esecuzione vengono completate in modo che il lavoro non venga perso.

  • di precedenza immediata: eseguire immediatamente tutte le attività in esecuzione annullando tutte le attività in esecuzione in modo che le risorse possano essere allocate immediatamente al processo con priorità elevata. Per altre informazioni sull'annullamento di processi e attività, vedere la sezione considerazioni aggiuntive in Annullare un processo o un'attività.

  • di precedenza a livello di attività (introdotta in HPC Pack 2008 R2 con SP3): abilitare la precedenza di singole attività anziché di interi processi. Con le impostazioni predefinite di precedenza immediata, l'utilità di pianificazione annulla un intero processo se sono necessarie risorse per un processo con priorità più alta. Quando si abilita la precedenza a livello di attività, l'utilità di pianificazione annulla invece le singole attività. Ad esempio, se un processo con priorità normale esegue 100 attività su 1 core e viene inviato un processo con priorità alta che richiede 10 core, la precedenza a livello di attività annulla 10 attività anziché annullare l'intero processo. Questa opzione può migliorare la velocità effettiva del processo riducendo al minimo la quantità di rielaborazione che deve essere eseguita a causa di una precedenza.

    Nota

    A partire da HPC Pack 2012, in modalità di pianificazione in coda, l'opzione predefinita per il comportamento di precedenza è la precedenza immediata a livello di attività, anziché la precedenza a livello di processo. Questo comportamento predefinito significa che solo molte attività di processi con priorità bassa vengono annullate in base alle esigenze per fornire le risorse necessarie per i processi con priorità più alta, invece di impedire tutte le attività nei processi con priorità bassa.

    Nota

    A partire da HPC Pack 2012 con Service Pack 1 (SP1), un processo di architettura orientata ai servizi terminerà le attività al termine della richiesta corrente, anche se sono presenti richieste aggiuntive da calcolare. Nelle versioni precedenti di HPC Pack, un processo SOA terminerà le attività per rilasciare le risorse per altri processi solo dopo che tutte le richieste vengono calcolate.

  • Nessunadi precedenza: non eseguire il preempt jobs.

Allocazione di risorse adattive

L'allocazione di risorse adattive regola in modo dinamico le risorse allocate a un processo in base alle relative attività. L'abilitazione delle regolazioni delle risorse può comportare un miglioramento significativo dell'utilizzo del cluster e una riduzione dei tempi di coda dei processi, in particolare per i cluster che eseguono processi composti da più attività, ad esempio calcoli di sweep parametrici. Solo i processi che contengono più attività o sottoattività possono trarre vantaggio dalla regolazione automatica delle risorse.

L'allocazione adattiva include le impostazioni seguenti che possono essere abilitate o disabilitate:

  • Aumentare automaticamente le risorse (abilitate per impostazione predefinita): usare le risorse disponibili per aumentare la priorità più alta, eseguendo i processi al massimo prima di avviare processi con priorità più bassa. Con l'abilitazione della crescita automatica, il servizio Utilità di pianificazione processi HPC può allocare risorse gratuite ai processi in esecuzione con attività aggiuntive da eseguire. Il servizio non allocherà più risorse del numero massimo richiesto per il processo. In questo modo, i processi passano più tempo nella coda in attesa delle risorse, ma terminano più rapidamente dopo l'avvio. Le risorse disponibili vengono allocate per prime al processo con priorità più alta nel sistema, indipendentemente dal fatto che questo processo sia in esecuzione o in coda.

    • Grow by preemption (introdotto in HPC Pack 2008 R2 con SP2): per aumentare al massimo i processi in esecuzione con priorità più alta, usare la precedenza per eliminare le risorse dalla priorità più bassa e i processi in esecuzione. Per usare questa impostazione, è necessario abilitare la precedenza.
  • Ridurre automaticamente le risorse (abilitate per impostazione predefinita): con la riduzione automatica abilitata, il servizio Utilità di pianificazione processi HPC può rilasciare risorse inutilizzate dall'esecuzione di processi che non dispongono di attività aggiuntive da eseguire. Il servizio non ridurrà le risorse al di sotto del valore minimo richiesto per il processo. La riduzione automatica comporta un migliore utilizzo complessivo del cluster, ma può causare problemi se si aggiungono attività ai processi già in corso.

Nota

Nel modello di processo predefinito, le proprietà del processo Calcolo automatico massimo e Auto Calculate Minimum sono impostate su un valore predefinito True. Se un modello di processo specifica che True è l'unico valore valido per queste proprietà, l'utente che invia non avrà la possibilità di specificare le risorse massime e minime per un processo inviato con tale modello e le risorse verranno calcolate automaticamente in base alle attività nel processo.

Impostazioni della modalità bilanciata

In modalità bilanciata, il servizio utilità di pianificazione processi HPC tenta di avviare tutti i processi in ingresso il prima possibile in base ai requisiti minimi delle risorse. Dopo che tutti i processi nella coda hanno le risorse minime, le risorse cluster aggiuntive vengono allocate ai processi in base alla priorità. L'allocazione delle risorse viene periodicamente ribilanciata per riempire le risorse inattive, avviare nuovi processi e regolare l'allocazione in base all'impostazione priorità di . Le sezioni seguenti descrivono le impostazioni associate alla modalità bilanciata.

Nota

  • La pianificazione bilanciata è limitata in situazioni in cui i gruppi di nodi si sovrappongono. La modalità bilanciata è più efficace nei gruppi di nodi non sovrapposti.
  • Se si specifica che un processo deve essere eseguito in un singolo nodo (disponibile a partire da HPC Pack 2012), il bilanciamento eseguito dal servizio utilità di pianificazione processi HPC può essere limitato da altri processi in esecuzione nel cluster.

Precedenza del processo

La precedenza in modalità bilanciata consente l'avvio prima dei processi in attesa nella coda, eliminando le risorse dai processi preemptible già in esecuzione.

Importante

Le impostazioni di precedenza in modalità bilanciata possono essere configurate solo da un amministratore HPC a partire da HPC Pack 2012 con Service Pack 1 (SP1). Nelle versioni precedenti di HPC Pack, la precedenza in modalità bilanciata è sempre Immediata.

Nota

La proprietà processo preemptable è definita dall'amministratore nei modelli di processo. Usare i modelli di processo per definire i tipi di processi che possono essere annullati o i set di utenti che possono inviare processi non superati o non superati. non è possibile definire preemptable quando si invia un processo tramite HPC Cluster Manager, HPC Job Manager, HPC PowerShell o gli strumenti da riga di comando HPC. È possibile eseguire questa operazione solo usando l'API HPC, se il modello di processo selezionato specifica sia True che False come valori validi per la proprietà del processo Preemptable. Il valore predefinito è True.

La precedenza in modalità bilanciata include le opzioni seguenti:

  • Annullamento immediato (impostazione predefinita): eseguire immediatamente le risorse dal processo annullato annullando e accodando le attività in esecuzione sufficienti in modo che le risorse possano essere allocate immediatamente a un altro processo. Per la maggior parte dei carichi di lavoro del cluster, la precedenza immediata in modalità bilanciata consente l'avvio di più processi in un determinato periodo di tempo. Per questo motivo è consigliabile nella maggior parte dei casi ottenere una pianificazione bilanciata.

  • la precedenza normale: prendere le risorse dal processo non superato man mano che le attività in esecuzione vengono completate in modo che il lavoro non venga perso. Si tratta di un'impostazione avanzata che deve essere abilitata solo per carichi di lavoro specifici. Ad esempio, può essere considerato quando si usa la modalità bilanciata con processi SOA (Service-Oriented Architecture) costituiti da attività a esecuzione prolungata, in cui è fondamentale mantenere i risultati ritunati da ogni attività intermedia.

    Cautela

    La precedenza normale in modalità bilanciata può rallentare il tempo di risposta dell'avvio di un nuovo processo e ridurre la velocità di bilanciamento. Il cluster deve essere testato attentamente e monitorato quando è abilitata la precedenza normale in modalità bilanciata. Per altre informazioni, vedere le considerazioni aggiuntive seguenti.

Considerazioni aggiuntive per il preemption in modalità bilanciata

  • velocità di bilanciamento modalità bilanciata tenta di bilanciare i processi il più rapidamente possibile, usando la precedenza immediata per impostazione predefinita. Se si sceglie di abilitare la precedenza normale in modalità bilanciata, il bilanciamento può essere eseguito solo alla velocità di uscita delle attività. Se nel cluster sono presenti attività a esecuzione prolungata, il bilanciamento può richiedere molto tempo. Se la frequenza dei processi in ingresso supera la frequenza delle attività di uscita, il cluster verrà bilanciato solo quando le attività sufficienti sono state arrestate per riallocare le risorse.

  • utilizzo delle risorse Per impostazione predefinita in modalità bilanciata, il servizio utilità di pianificazione processi HPC annulla immediatamente le attività per liberare le risorse (ad esempio core, nodi o socket) necessarie per qualsiasi processo in attesa. Tuttavia, se è abilitata una normale precedenza, le risorse vengono liberate al termine delle attività, indipendentemente dai requisiti delle risorse di un processo in attesa. È possibile che le risorse liberate non siano quelle richieste dal processo in attesa successivo e che le risorse rimangano inattive fino al termine di altre attività.

Distorsione priorità

priorità bias controlla la modalità di allocazione di risorse aggiuntive ai processi. In modalità bilanciata, "risorse aggiuntive" si riferisce alla risorsa cluster al di sopra delle risorse minime totali per tutti i processi in esecuzione. Le attività in esecuzione su risorse aggiuntive possono essere annullate con una precedenza immediata per supportare nuovi processi o per convergere sul modello di allocazione desiderato.

priorità ha le opzioni seguenti:

  • high bias: tutte le risorse aggiuntive vengono allocate ai processi con priorità più alta.

  • media bias (impostazione predefinita): a ogni banda di priorità viene assegnata una percentuale maggiore di risorse aggiuntive rispetto alla banda sottostante. Le bande di priorità sono , Above Normal, Normal, Below Normale Lowest.

  • Nessunbias: le risorse aggiuntive vengono allocate equamente nella coda del processo.

Intervallo di ribilanciamento

Il Intervallo di ribilanciamento rappresenta il tempo, espresso in secondi, tra i passaggi di ribilanciamento. Il valore predefinito è 10 secondi.

Un intervallo più lungo può migliorare le prestazioni dell'utilità di pianificazione, ma può richiedere più tempo per rispondere ai nuovi processi e convergere sul modello di allocazione desiderato. Gli intervalli più lunghi sono validi se non è necessario aumentare e ridurre immediatamente. Se il cluster ha una frequenza di turnaround elevata (i processi vengono inviati frequentemente e terminano rapidamente), potrebbe essere necessario un intervallo più lungo per evitare un aumento eccessivo e una riduzione eccessiva.

Un intervallo di ribilanciamento più breve offre una risposta più veloce quando vengono inviati nuovi processi, a costo di carico aggiuntivo nel nodo head. Le altre impostazioni che è possibile modificare se sono necessarie risposte più veloci sono il periodo di tolleranza di annullamento attività attività e il timeout dell'attività di rilascio, che può richiedere più tempo per il lavoro in esecuzione per uscire dal modo in cui viene eseguito il push.

Riferimenti aggiuntivi