Procedure di manutenzione del cluster di failover
Si applica a: Azure Stack HCI, versioni 22H2 e 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
Importante
Azure Stack HCI is now part of Azure Local. La ridenominazione della documentazione del prodotto è in corso. Tuttavia, le versioni precedenti di Azure Stack HCI, ad esempio 22H2 continueranno a fare riferimento ad Azure Stack HCI e non rifletteranno la modifica del nome. Altre informazioni.
Questo articolo presuppone che sia necessario spegnere un server fisico per eseguire la manutenzione o riavviarlo per qualche altro motivo. Per installare gli aggiornamenti in un cluster Azure Stack HCI senza portare offline i server, vedere Aggiornare i cluster Azure Stack HCI.
L'uso offline di un server per la manutenzione richiede la connessione offline di parti dell'archiviazione condivise tra tutti i server in un cluster di failover. Ciò richiede la sospensione del server che si vuole portare offline, l'inserimento dei dischi del server in modalità di manutenzione, lo spostamento di ruoli cluster e macchine virtuali (VM) in altri server del cluster e la verifica che tutti i dati siano disponibili negli altri server del cluster. Questo processo garantisce che i dati rimangano sicuri e accessibili durante il periodo di manutenzione.
Puoi usare Windows Admin Center o PowerShell per portare un server offline per la manutenzione. Questo argomento illustra entrambi i metodi.
Portare un server offline con Windows Admin Center
Il modo più semplice per prepararsi a portare offline un server consiste nell'usare Windows Admin Center.
Verificare che sia sicuro portare offline il server
Usando Windows Admin Center, connettersi al server che si vuole portare offline. Selezionare Dischi di archiviazione > dal menu Strumenti e verificare che la colonna Stato per ogni disco virtuale sia online.
Selezionare quindi Volumi di archiviazione > e verificare che la colonna Integrità per ogni volume mostri Integro e che la colonna Stato per ogni volume mostri OK.
Sospendere e svuotare il server
Prima di arrestare o riavviare un server, è necessario sospendere il server e svuotare (spostare) tutti i ruoli del cluster, ad esempio le macchine virtuali in esecuzione. Sospendere e svuotare sempre i server in cluster prima di portarli offline per la manutenzione.
Usando Windows Admin Center, connettersi al cluster e quindi selezionare > Server di calcolo dal menu Strumenti in Gestione cluster.
Selezionare Scorte. Fare clic sul nome del server che si desidera sospendere e svuotare e selezionare Sospendi. Verrà visualizzato il prompt seguente:
Sospendere i server per la manutenzione: sospendere i server? In questo modo i carichi di lavoro, ad esempio le macchine virtuali, vengono spostati in altri server del cluster.
Selezionare Sì per sospendere il server e avviare il processo di svuotamento. Lo stato del server verrà visualizzato come In manutenzione, Svuotamento e ruoli, ad esempio Hyper-V e macchine virtuali, inizierà immediatamente la migrazione in tempo reale ad altri server nel cluster. L'operazione potrebbe richiedere alcuni minuti. Non è possibile aggiungere ruoli al server fino a quando non viene ripreso. Al termine del processo di svuotamento, lo stato del server verrà visualizzato come In manutenzione, Svuotamento completato. Il sistema operativo esegue un controllo di sicurezza automatico per assicurarsi che sia sicuro procedere. Se sono presenti volumi non integri, si arresterà e si avvisa che non è sicuro procedere.
Arrestare il server
Una volta completato lo svuotamento del server, è possibile arrestarlo in modo sicuro per la manutenzione o riavviarlo.
Avviso
Se il server esegue Azure Stack HCI, versione 20H2, Windows Server 2019 o Windows Server 2016, è necessario inserire i dischi in modalità di manutenzione prima di arrestare il server e disattivare la modalità di manutenzione prima di riprendere il server nel cluster.
Riprendere il server
Quando si è pronti per consentire al server di iniziare di nuovo a ospitare ruoli e macchine virtuali in cluster, è sufficiente attivare il server, attendere l'avvio e riprendere il server seguendo questa procedura.
In Gestione cluster selezionare > Server di calcolo dal menu Strumenti a sinistra.
Selezionare Scorte. Fare clic sul nome del server da riprendere e quindi su Riprendi.
I ruoli e le macchine virtuali in cluster inizieranno immediatamente la migrazione in tempo reale al server. L'operazione potrebbe richiedere alcuni minuti.
Attendere la risincronizzazione dell'archiviazione
Quando il server riprende, tutte le nuove scritture che si sono verificate mentre non erano disponibili devono essere risincronizzate. Questo avviene automaticamente, usando il rilevamento intelligente delle modifiche. Non è necessario analizzare o sincronizzare tutti i dati, ma solo le modifiche. Questo processo è limitato per ridurre l'impatto sui carichi di lavoro di produzione. A seconda della durata della sospensione del server e della quantità di nuovi dati scritti, il completamento potrebbe richiedere molti minuti.
Importante
Prima di portare offline altri server nel cluster, è necessario attendere il completamento della sincronizzazione.
Per verificare se la risincronizzazione dell'archiviazione è stata completata:
- Connettersi al cluster usando Windows Admin Center e selezionare Volumi di archiviazione>.
- Selezionare Scorte.
- Controllare la colonna Stato per ogni volume. Se viene visualizzato OK, la risincronizzazione dell'archiviazione è stata completata. È ora possibile portare offline altri server nel cluster.
Portare un server offline con PowerShell
Usare le procedure seguenti per sospendere, svuotare e riprendere correttamente un server in un cluster di failover tramite PowerShell.
Verificare che sia sicuro portare offline il server
Per verificare che tutti i volumi siano integri, eseguire il cmdlet seguente come amministratore:
Get-VirtualDisk
Di seguito è riportato un esempio dell'aspetto dell'output:
FriendlyName ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus Size FootprintOnPool StorageEfficiency
------------ --------------------- --------------------- ----------------- ------------ ---- --------------- -----------------
Mirror II Mirror 1 OK Healthy 4 TB 8.01 TB 49.99%
Mirror-accelerated parity OK Healthy 1002 GB 1.96 TB 49.98%
Mirror Mirror 1 OK Healthy 1 TB 2 TB 49.98%
ClusterPerformanceHistory Mirror 1 OK Healthy 24 GB 49 GB 48.98%
Verificare che la proprietà HealthStatus per ogni volume sia Integro e OperationalStatus mostri OK.
A tale scopo, usare Gestione cluster di failover, passare a Dischi di archiviazione>.
Sospendere e svuotare il server
Eseguire il cmdlet seguente come amministratore per sospendere e svuotare il server:
Suspend-ClusterNode -Drain
A tale scopo, in Gestione cluster di failover passare a Nodi, fare clic con il pulsante destro del mouse sul nodo e quindi scegliere Sospendi>ruoli di svuotamento.
Se il server esegue Azure Stack HCI, versione 21H2 o Windows Server 2022, sospendere e svuotare il server inserirà anche i dischi del server in modalità di manutenzione. Se il server esegue Azure Stack HCI, versione 20H2, Windows Server 2019 o Windows Server 2016, è necessario eseguire questa operazione manualmente (vedere il passaggio successivo).
Inserire i dischi in modalità di manutenzione
In Azure Stack HCI versione 20H2, Windows Server 2019 e Windows Server 2016, l'inserimento dei dischi del server in modalità di manutenzione offre Spazi di archiviazione diretta l'opportunità di scaricare ed eseguire il commit dei dati per garantire che l'arresto del server non influisca sullo stato dell'applicazione. Non appena un disco passa alla modalità di manutenzione, non consente più le scritture. Per ridurre al minimo i tempi di risincronizzazione dello spazio di archiviazione, è consigliabile inserire i dischi in modalità di manutenzione subito prima del riavvio e rimuoverli dalla modalità di manutenzione non appena viene eseguito il backup del sistema.
Nota
Se il server esegue Azure Stack HCI versione 21H2 o Windows Server 2022, è possibile ignorare questo passaggio perché i dischi vengono inseriti automaticamente in modalità di manutenzione quando il server viene sospeso e svuotato. Questi sistemi operativi hanno una funzionalità di riparazione granulare che rende le risincronizzazioni più veloci e meno interessate sulle risorse di sistema e di rete, rendendo possibile eseguire la manutenzione del server e dell'archiviazione insieme.
Se il server esegue Windows Server 2019 o Azure Stack HCI versione 20H2, eseguire il cmdlet seguente come amministratore:
Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode
Se il server esegue Windows Server 2016, usare invece la sintassi seguente:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode
Arrestare il server
Una volta completato lo svuotamento del server, verrà visualizzato come Sospeso in PowerShell e Gestione cluster di failover.
È ora possibile arrestare o riavviare il server in modo sicuro usando i Stop-Computer
cmdlet di PowerShell o Restart-Computer
Gestione cluster di failover.
Nota
Quando si esegue un Get-VirtualDisk
comando nei server che arrestano o arrestano o arrestano il servizio cluster, lo stato operativo del server potrebbe essere segnalato come incompleto o danneggiato e la colonna Stato integrità potrebbe elencare un avviso. Questo è normale e non dovrebbe causare preoccupazioni. Tutti i volumi rimangono online e accessibili.
Disconnesso dalla modalità di manutenzione
Se il server esegue Azure Stack HCI versione 20H2, Windows Server 2019 o Windows Server 2016, è necessario disabilitare la modalità di manutenzione dell'archiviazione sui dischi prima di riprendere il server nel cluster. Per ridurre al minimo i tempi di risincronizzazione dell'archiviazione, è consigliabile rimuoverli dalla modalità di manutenzione non appena il sistema viene eseguito il backup.
Nota
Se il server esegue Azure Stack HCI versione 21H2 o Windows Server 2022, è possibile ignorare questo passaggio perché i dischi verranno rimossi automaticamente dalla modalità di manutenzione quando il server viene ripreso.
Se il server esegue Windows Server 2019 o Azure Stack HCI versione 20H2, eseguire il cmdlet seguente come amministratore per disabilitare la modalità di manutenzione dell'archiviazione:
Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode
Se il server esegue Windows Server 2016, usare invece la sintassi seguente:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode
Riprendere il server
Riprendere il server nel cluster. Per restituire i ruoli cluster e le macchine virtuali in esecuzione in precedenza nel server, usare il flag facoltativo -Failback :
Resume-ClusterNode –Failback Immediate
Per eseguire questa operazione in Gestione cluster di failover, passare a Nodi, fare clic con il pulsante destro del mouse sul nodo e quindi scegliere Riprendi ruoli>di failback.
Una volta ripreso il server, verrà visualizzato come Up in PowerShell e Gestione cluster di failover.
Attendere la risincronizzazione dell'archiviazione
Quando il server viene ripreso, è necessario attendere il completamento della sincronizzazione prima di portare offline altri server nel cluster.
Eseguire il cmdlet seguente come amministratore per monitorare lo stato di avanzamento:
Get-StorageJob
Se la sincronizzazione è già stata completata, non si otterrà alcun output.
Ecco un esempio di output che mostra i processi di risincronizzazione (ripristino) ancora in esecuzione:
Name IsBackgroundTask ElapsedTime JobState PercentComplete BytesProcessed BytesTotal
---- ---------------- ----------- -------- --------------- -------------- ----------
Repair True 00:06:23 Running 65 11477975040 17448304640
Repair True 00:06:40 Running 66 15987900416 23890755584
Repair True 00:06:52 Running 68 20104802841 22104819713
La colonna BytesTotal mostra la quantità di spazio di archiviazione necessario per la risincronizzazione. La colonna PercentComplete visualizza lo stato di avanzamento.
Avviso
Non è sicuro portare offline un altro server fino al termine di questi processi di ripristino.
Durante questo periodo, in HealthStatus, i volumi continueranno a essere visualizzati come Avviso, che è normale.
Ad esempio, se si usa il cmdlet durante la Get-VirtualDisk
sincronizzazione dell'archiviazione, è possibile che venga visualizzato l'output seguente:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror InService Warning True 1 TB
MyVolume2 Mirror InService Warning True 1 TB
MyVolume3 Mirror InService Warning True 1 TB
Al termine dei processi, verificare che i volumi visualizzino di nuovo Integro usando il Get-VirtualDisk
cmdlet . Ecco un esempio di output:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror OK Healthy True 1 TB
MyVolume2 Mirror OK Healthy True 1 TB
MyVolume3 Mirror OK Healthy True 1 TB
È ora possibile sospendere e riavviare altri server nel cluster.
Passaggi successivi
Per ulteriori informazioni, vedere anche: