Condividi tramite


Informazioni sugli stati dei nodi, sull'integrità e sulle operazioni

stato del nodo riflette lo stato di distribuzione di un nodo e se un amministratore vuole che il nodo sia disponibile come risorsa per i processi del cluster. Un amministratore porta un nodo allo stato Online per indicare che il nodo deve accettare processi o richieste client.

integrità dei nodi indica se sono presenti avvisi o errori che i servizi HPC sono a conoscenza di in tale nodo. Se il nodo ha un valore di integrità del nodo Error, il nodo non sarà in grado di accettare processi o richieste client, anche se lo stato del nodo è Online.

Durante le normali operazioni, i nodi hanno un valore di integrità del nodo pari a OK. L'elenco seguente descrive i valori normali dello stato del nodo:

  • Il nodo head ha un valore dello stato del nodo Offline. Se il nodo head funge anche da nodo di calcolo o da un nodo broker WCF o se viene installato un nodo head per la disponibilità elevata, il valore dello stato normale del nodo è Online.

  • I nodi di calcolo e i nodi broker di Windows Communication Foundation (WCF) hanno un valore dello stato del nodo Online.

  • I nodi della workstation possono avere un valore dello stato del nodo online o offline in base ai criteri di disponibilità.

  • I nodi di Windows Azure definiti ma non distribuiti in Windows Azure hanno un valore di stato normale del nodo Non distribuito. I nodi di Windows Azure distribuiti hanno un valore di stato normale del nodo Online.

Parte del processo di monitoraggio e gestione dell'integrità del cluster consiste nel trovare deviazioni dallo stato normale del nodo e dall'integrità e monitorare lo stato delle operazioni del cluster.

Le sezioni di questo argomento descrivono i valori per:

Stati del nodo

Gli stati del nodo riflettono lo stato di distribuzione di un nodo e se un amministratore vuole che il nodo sia disponibile come risorsa per i processi del cluster.

Quando il nodo head rileva per la prima volta un nodo locale nella rete, il nodo viene visualizzato nello stato Sconosciuto. Quando un amministratore aggiunge un nodo al cluster assegnando un modello di nodo, il nodo passa allo stato provisioning. Quando il nodo è stato aggiunto correttamente al cluster, passa allo stato offline.

Quando un amministratore aggiunge nodi di Windows Azure al cluster, questi vengono visualizzati nello stato Non distribuito. Quando i nodi di Windows Azure vengono avviati (ovvero le istanze vengono distribuite in Windows Azure), i nodi passano allo stato provisioning. Al termine del provisioning, un nodo di Windows Azure avviato manualmente passa allo stato offline e un nodo di Windows Azure avviato automaticamente passa allo stato online .

Quando un amministratore aggiunge nodi workstation e nodi server non gestiti al cluster e dopo l'assegnazione del modello di nodo, può essere portato online per eseguire i processi del cluster e quindi portato offline per riprendere i normali carichi di lavoro. I nodi configurati nel modello di nodo da portare online e offline inizialmente saranno offline. I nodi configurati per essere portati online e offline in base a un criterio di disponibilità settimanale inizieranno a seguire tale criterio e verranno portati online automaticamente durante gli intervalli pianificati.

Un amministratore porta un nodo online o accetta un nodo offline per indicare se i nodi devono accettare ed eseguire processi del cluster. I nodi di Windows Azure e i nodi della workstation possono anche essere portati online o offline in base a un criterio di disponibilità settimanale. Il servizio utilità di pianificazione processi HPC tenterà di avviare nuovi processi solo nei nodi che si trovano nello stato online. Per rendere un nodo non disponibile per i nuovi processi, gli amministratori possono prendere il nodo offline. I nodi devono trovarsi nello stato offline per eseguire alcune azioni di gestione, ad esempio Reimage o Mantieni.

È possibile usare la visualizzazione elenco dei nodi per visualizzare lo stato di ogni nodo e filtrare i nodi di calcolo in base allo stato del nodo.

Nella tabella seguente vengono descritti i valori dello stato del nodo:

Stato nodo Descrizione
online Questo stato indica che il nodo deve accettare ed eseguire processi del cluster. Per i nodi broker WCF, questo stato indica che devono essere disponibili per gestire le sessioni SOA. Il servizio utilità di pianificazione processi HPC tenterà di allocare il lavoro solo ai nodi che si trovano nello stato online.

Un nodo deve trovarsi nello stato del nodo Online e integro per eseguire processi (o gestire sessioni). Se l'integrità del nodo è Errore, i processi non saranno in grado di avviarsi in tale nodo.

I nodi possono essere portati online o offline dall'amministratore del cluster. È anche possibile portare nodi di Windows Azure, nodi della workstation e nodi server non gestiti online o offline in base a criteri di disponibilità settimanali.
offline Questo stato indica che il nodo non deve essere usato per eseguire i processi del cluster. Per i nodi broker WCF, indica che non deve essere usato per gestire le sessioni SOA. Questo stato consente a un amministratore del cluster di eseguire script, installare software ed eseguire altre attività nel nodo. Si tratta dello stato predefinito di un nodo dopo che un amministratore del cluster ha approvato il nodo per l'inclusione nel cluster.

Questo è lo stato normale per un nodo head (a meno che non sia installato per la disponibilità elevata). È possibile portare un nodo head online se si vuole che esegua ruoli di nodo aggiuntivi, ad esempio nodo di calcolo o nodo broker WCF. Per altre informazioni, vedere Understanding Node Roles in Microsoft HPC Pack.

I nodi possono essere portati online o offline dall'amministratore del cluster. È anche possibile portare nodi di Windows Azure, nodi della workstation e nodi server non gestiti online o offline in base a criteri di disponibilità settimanali.

Se un nodo viene portato offline durante l'esecuzione dei processi, passerà prima attraverso lo stato svuotamento. Se un amministratore sceglie di forzare immediatamente la modalità offline del nodo, tutte le attività in esecuzione verranno annullate e accodate all'interno del processo.
sconosciuto Questo stato indica che il nodo non fa parte del cluster o che un'operazione di provisioning non è riuscita in tale nodo.

Per aggiungere un nodo al cluster, applicare l'azione Assegna modello di nodo al nodo.

In un cluster a disponibilità elevata, dopo l'esecuzione dell'installazione nel primo nodo head, il secondo nodo head si troverà nello stato Sconosciuto fino all'esecuzione dell'installazione in tale nodo. Dopo l'installazione, il secondo nodo head passa allo stato Online.
provisioning Nodi locali

Questo stato indica che il nodo è configurato come nodo del cluster. L'Assegna modello di nodo, Reimagee Gestire azioni inserisce anche un nodo nello stato di provisioning. Al termine del provisioning, il nodo passa allo stato offline .

Nodi di Windows Azure

Questo stato indica che l'istanza del nodo viene distribuita in Windows Azure. L'azione start
o un criterio di disponibilità automatica può impostare un nodo di Windows Azure nello stato di provisioning. Al termine del provisioning, un nodo di Windows Azure avviato manualmente passa allo stato offline e un nodo di Windows Azure avviato automaticamente passa allo stato online.
Avvio Questo stato indica che il nodo passa dalla modalità di offline alla modalità Online. Nota: L'azione avvia non inserisce i nodi nello stato Avvio. L'azione start si applica solo ai nodi di Windows Azure e viene usata per distribuire istanze del nodo in Windows Azure. Quando viene applicata l'azione avvia , i nodi passano allo stato Provisioning.
svuotamento Questo stato indica che il nodo è stato portato offline e sta passando allo stato offline. Il nodo completa i processi attualmente in esecuzione prima di passare allo stato offline. i nodi di svuotamento non accettano nuovi processi.
Rimozione di Questo stato indica che le informazioni sul nodo vengono rimosse dal database di HPC Node Management Services. L'azione elimina inserisce un nodo in questo stato. Nulla viene modificato nel nodo eliminato.

Se il nodo tenta di ricongiuscrirsi al cluster, verrà creata una nuova voce per tale nodo nel database e il nodo verrà visualizzato nello stato Sconosciuto.
rifiutata Questo stato indica che il nodo è stato rifiutato da un amministratore del cluster.
non distribuita Questo stato si applica solo ai nodi di Windows Azure.

Questo stato indica che il nodo di Windows Azure è stato definito e aggiunto al cluster, ma il nodo non è stato avviato ed eseguito il provisioning in Windows Azure (l'istanza del nodo non è stata creata in Windows Azure). I nodi di Windows Azure vengono distribuiti in base ai criteri di disponibilità definiti nel modello di nodo: manualmente (con l'azione avvia ) o automaticamente in base a una pianificazione settimanale.

I nodi di Windows Azure nello stato Non distribuito non comportano addebiti in Windows Azure.
arresto Questo stato si applica solo ai nodi di Windows Azure.

Questo stato indica che l'istanza del nodo di Windows Azure viene rimossa da Windows Azure. I nodi di Windows Azure vengono arrestati in base ai criteri di disponibilità definiti nel modello di nodo: manualmente (con l'azione Arresta) o automaticamente in base a una pianificazione settimanale.

Al termine delle operazioni di arresto (l'istanza del nodo viene rimossa da Windows Azure), il nodo passa allo stato non distribuito .

Integrità nodo

integrità dei nodi indica se sono presenti avvisi o errori che i servizi HPC sono a conoscenza di in tale nodo.

È possibile usare la visualizzazione elenco dei nodi per visualizzare l'integrità di ogni nodo di calcolo e filtrare i nodi in base all'integrità del nodo. Se l'integrità del nodo è errore o avviso, esaminare le informazioni nella scheda integrità del nodo per altri dettagli. È possibile visualizzare la scheda Integrità nodo nella riquadro dettagli (nella visualizzazione elenco) oppure facendo doppio clic su un nodo.

Nella tabella seguente vengono descritti i valori di integrità dei nodi:

Integrità nodo Descrizione
ok I servizi HPC non sono a conoscenza di problemi con il nodo.
avviso Questo valore può indicare quanto segue:

- Un amministratore del cluster ha eseguito test di diagnostica nel nodo e uno o più test hanno restituito il risultato di errore o Non è stato possibile eseguire. Un amministratore può cancellare manualmente gli avvisi di diagnostica ( vedere Risolvere e cancellare gli avvisi di diagnostica).
- Una o più operazioni sui nodi si trovano nello stato Failed, Revertedo Canceled. Leggere il log operazioni per analizzare il problema.

Esaminare le informazioni nella scheda integrità dei nodi per iniziare a esaminare il problema.
errore Questo valore può indicare quanto segue:

- Il nodo non è raggiungibile, come determinato dalle opzioni heartbeat .
- Provisioning non riuscito.
- Il nodo è stato rifiutato da un amministratore del cluster. È possibile assegnare un modello di nodo se si decide di aggiungere il nodo al cluster.

Esaminare le informazioni nella scheda integrità dei nodi per iniziare a esaminare il problema.
transitorio Questo valore indica che il nodo esegue un'operazione avviata da un amministratore del cluster, ad esempio:

- Assegnare il modello di nodo, Reimageo Mantieni (nel qual caso lo stato del nodo è Provisioning).
- Bring Online (in questo caso lo stato del nodo è Starting).
- Porta offline (nel qual caso lo stato del nodo è svuotamento).
- Avviare per i nodi di Windows Azure, nel qual caso lo stato del nodo è Provisioning).

Per altre informazioni o per annullare l'operazione, visualizzare la scheda 'integrità del nodo.
non approvati Nodi locali

Il nodo è stato rilevato dal nodo head, ma non fa parte del cluster. Assegnare un modello di nodo per aggiungere il nodo al cluster. Vedere anche Aggiunta di nodi a un cluster.

Nodi di Windows Azure

Il nodo è stato aggiunto al cluster, ma il nodo non è stato avviato ed è stato eseguito il provisioning in Windows Azure (l'istanza del nodo non esiste in Windows Azure).

Stati dell'operazione

Per informazioni su come visualizzare il log delle operazioni, vedere Leggere il log delle operazioni.

Nella tabella seguente vengono descritti i valori dello stato dell'operazione:

Stato operazione Descrizione
archiviato L'operazione è superiore a 24 ore o il test di diagnostica è stato cancellato. Quando un'operazione viene archiviata, viene rimossa da altri report di stato.
di cui è stato eseguito il commit Operazione completata correttamente.
esecuzione di L'operazione è in corso.
non riuscito Impossibile eseguire l'operazione.
ripristino L'operazione viene ripristinata. Al termine della pulizia dell'operazione, l'operazione passerà allo stato Ripristinato.
non è stato possibile ripristinare La pulizia dell'operazione non è riuscita.
ripristinato Operazione annullata dopo un errore o un annullamento.

Riferimenti aggiuntivi