Eseguire un'esercitazione sul ripristino di emergenza

Completato

In questa unità si apprenderanno informazioni sulle esercitazioni sul ripristino di emergenza, ad esempio in merito a quali elementi è necessario prendere in considerazione e a come eseguire un test per controllare che la configurazione sia corretta.

È possibile usare le esercitazioni sul ripristino di emergenza per testare la capacità dell'organizzazione di eseguire il ripristino in seguito a un'interruzione senza alcun impatto sui servizi di produzione.

Nell'esercizio precedente è stata completata la configurazione di Azure Site Recovery e ora è necessario testare la replica dell'infrastruttura. Testare la configurazione eseguendo un'esercitazione sul ripristino di emergenza. Azure Site Recovery consente di eseguire queste esercitazioni in modo sicuro, senza alcun impatto sull'ambiente di produzione. Verranno inoltre eseguiti alcuni controlli di qualità sulla configurazione per garantire il funzionamento della soluzione di ripristino di emergenza.

Che cos'è un'esercitazione sul ripristino di emergenza?

Un'esercitazione sul ripristino di emergenza è un modo per controllare se la soluzione è stata configurata correttamente. L'esercitazione dà la certezza all'utente e all'azienda che i dati e i servizi saranno disponibili anche in caso di emergenza. In genere, le organizzazioni impostano un obiettivo del tempo di ripristino (RTO) che indica il tempo necessario per il ripristino dell'infrastruttura. È necessario anche che l'azienda definisca un obiettivo del punto di ripristino (RPO), che stabilisce la quantità di perdita di dati accettabile in funzione del tempo. Ad esempio, se l'obiettivo del punto di ripristino dell'azienda è un giorno, è necessario creare un backup di tutti i dati ogni giorno. È anche necessario assicurarsi che il ripristino del backup richieda meno di un giorno.

Screenshot che mostra la suddivisione dei test di failover eseguiti.

Per assicurarsi che i test di ripristino di emergenza vengano eseguiti, Site Recovery richiede attivamente di eseguirli nel relativo dashboard.

Perché è necessario eseguire un'esercitazione sul ripristino di emergenza?

Un'esercitazione sul ripristino di emergenza è fondamentale per garantire che la soluzione implementata soddisfi i requisiti di continuità aziendale e ripristino di emergenza (BCDR) dell'azienda e per garantire il corretto funzionamento della replica. L'esercitazione sul ripristino di emergenza, combinata con l'obiettivo del tempo di ripristino e l'obiettivo del punto di ripristino, deve essere testata accuratamente per assicurarsi che la replica, il failover e il ripristino avvengano entro l'intervallo di tempo richiesto.

Si supponga, ad esempio, che l'obiettivo del tempo di ripristino sia di un'ora e che l'obiettivo del punto di ripristino sia di sei ore. Se viene eseguito il backup dei sistemi ogni ora, significa un'ora di dati persi più un'ora aggiuntiva per ripristinare i sistemi.

Si immagini che il tempo di ripristino effettivo sia di cinque ore. I sistemi hanno un ritardo di aggiornamento di quasi oltre sei ore e quindi l'obiettivo del punto di ripristino del piano di continuità aziendale e ripristino di emergenza viene violato. Verificando il tempo effettivo necessario per il ripristino degli errori, è possibile avere la certezza che i sistemi rispettino i piani di continuità aziendale e ripristino di emergenza.

Failover di test di singoli computer

Un failover di test consente di simulare un'emergenza e di esaminarne gli effetti. È possibile avviare un test di failover dal dashboard di Site Recovery oppure direttamente dal menu di ripristino di emergenza in una macchina virtuale specifica. Si inizierà scegliendo un punto di ripristino. È possibile scegliere tra l'ultima elaborazione, il punto coerente con l'app più recente oppure un punto di ripristino personalizzato.

Creare un test del failover

Creare una rete virtuale isolata in modo da non influire sull'infrastruttura di produzione. A questo scopo, attenersi alla procedura seguente:

  1. Aprire la macchina virtuale di destinazione denominata patient-records. Un modo semplice per trovarla consiste nel filtrare tutte le risorse per visualizzare solo Tipo == Macchina virtuale. Selezionare patient-records dall'elenco dei risultati.

  2. Nel menu delle risorse scorrere verso Operazioni e quindi selezionare Ripristino di emergenza.

    Screenshot che mostra l'opzione di ripristino di emergenza delle operazioni per una macchina virtuale selezionata.

  3. Verrà visualizzato un nuovo riquadro Elementi replicati. Selezionare Aggiorna finché non viene visualizzato Protetto nel campo stato. Poi, nella barra dei menu in alto selezionare Failover di test.

    Screenshot che mostra il pulsante per il failover di test per una macchina virtuale selezionata.

  4. Al termine della convalida, selezionare la rete virtuale nell'elenco a discesa Rete virtuale di Azure e quindi selezionare il pulsante Failover di test. Questa opzione esegue un failover di test della macchina virtuale e consente di tenere traccia dello stato di avanzamento nella pagina Processi di Site Recovery selezionando l'icona Notifiche e selezionando il collegamento Avvio dell'attività per eseguire il failover di test della macchina virtuale.

  5. Al termine, la macchina virtuale sottoposta a failover verrà visualizzata nel portale in Macchine virtuali, nell'area di ripristino. È quindi possibile controllare che la macchina virtuale sia in esecuzione, che sia dimensionata e connessa correttamente e che esegua il mirroring della macchina virtuale di origine ma in un'area di Azure diversa.

  6. Dopo aver verificato che tutto funzioni come previsto, è possibile eliminare la macchina virtuale replicata selezionando Pulisci failover di test dal riquadro Ripristino di emergenza. A questo punto, è consigliabile aggiungere note sul risultato del test. Selezionare la casella accanto a Test completato per eliminare la macchina virtuale di failover di test, quindi selezionare OK.

Failover flessibile di più computer

Site Recovery offre la flessibilità necessaria per eseguire uno scenario di test di ripristino di emergenza completo per tutte le macchine virtuali. È possibile creare piani di ripristino che includono una o più macchine virtuali. I failover possono essere eseguiti tutte le volte che si vuole e consentono l'uso di criteri flessibili per testare combinazioni diverse di infrastruttura.

Screenshot che mostra un dashboard del failover di test usato per tenere traccia dell'esecuzione del processo di failover.

Proprio come nel caso del test delle singole macchine virtuali, è disponibile la stessa opzione di pulizia dei test per tutti gli elementi inclusi nel piano di ripristino.

Screenshot che mostra l'opzione di pulizia di un failover di test.

Differenza tra un'esercitazione e un failover di produzione

L'esecuzione di un failover di produzione in Site Recovery è simile a quella di un'esercitazione di test. Ci sono alcune differenze, come il fatto che viene selezionata l'opzione Failover al posto di Failover di test. È possibile scegliere di arrestare la macchina virtuale di origine prima di avviare il failover, in modo che non vengano persi dati durante il passaggio. Site Recovery non esegue la pulizia dell'ambiente di origine dopo il failover.

Al termine del failover, verificare che la macchina virtuale funzioni come previsto. Site Recovery consente di modificare il punto di ripristino in questa fase. Se si è soddisfatti del funzionamento del failover, scegliere Commit per eseguire il commit del failover. Site Recovery elimina tutti i punti di ripristino della macchina virtuale di origine e completa il failover. Con l'infrastruttura e i dati replicati nell'area secondaria, è necessario tenere presente che anche la nuova macchina virtuale nell'area secondaria necessita di protezione.