Introduzione
A volte, anche con una buona pianificazione, qualcosa può andare storto. Un'organizzazione che possiede e gestisce risorse IT deve essere pronta ad affrontare la peggiore delle eventualità e presumere che un giorno questa si verificherà. La pianificazione e il ripristino di emergenza sono tra gli elementi più critici dell'IT.
Le piattaforme cloud moderne offrono un'ampia gamma di strumenti che consentono alle organizzazioni di prepararsi ad affrontare circostanze avverse e a mitigarne gli effetti. I servizi di backup basati sul cloud, ad esempio, possono creare repliche dei dati archiviati in locale, in modo che i dati possano essere ripristinati qualora vengano eliminati, danneggiati o eliminati definitivamente. È possibile eseguire il backup anche di risorse IaaS, ad esempio macchine virtuali e carichi di lavoro SQL. Alcuni servizi PaaS prevedono backup automatici. Il database SQL di Azure, ad esempio, crea backup completi una volta alla settimana, backup differenziali ogni 12 ore e backup del log delle transazioni a intervalli di pochi minuti. I backup vengono archiviati nella risorsa di archiviazione con ridondanza geografica replicata in un data center associato. I database persi o danneggiati vengono ripristinati facilmente dai backup nello stato in cui erano in un momento passato scelto dall'utente.
La perdita di dati non è l'unica "emergenza" che i professionisti IT devono pianificare. Un piano di ripristino di emergenza completo garantisce anche la continuità dell'attività, ad esempio il reindirizzamento delle richieste ("failover") a una posizione secondaria quando un'applicazione non risponde o un'intera area di un cloud pubblico subisce un'interruzione. Il cloud è utile anche in questo caso, grazie al ripristino di emergenza distribuito come servizio. L'obiettivo attuale dell'architettura dei sistemi è evitare qualsiasi dipendenza da un componente che potrebbe diventare un singolo punto di guasto. Questo è il principio di base della resilienza: consentire e persino pianificare un livello ragionevole di errore all'interno del sistema, mantenendo tuttavia livelli di servizio accettabili per un'organizzazione e i clienti.
In questo modulo verrà prima di tutto fornita una descrizione completa di bug, errori e guasti. Verranno quindi presentate le tecniche di replica per il backup di applicazioni, servizi e dati per ridurre al minimo le possibilità di perdita per l'azienda e verranno esaminati i servizi di backup offerti dai principali provider di servizi cloud. Si approfondiranno quindi il ripristino di emergenza, il ripristino di emergenza distribuito come servizio e i meccanismi per mettere in atto la continuità aziendale. Verrà infine illustrato come i principi della resilienza nel cloud computing stanno spingendo le organizzazioni a prepararsi in modo diverso, ovvero sostituendo le misure reattive con altre proattive.
Obiettivi di apprendimento
- Comprendere il significato di "tolleranza di errore"
- Elencare le tecniche reattive usate per ottenere la tolleranza di errore nelle piattaforme cloud
- Elencare le tecniche proattive usate per ottenere la tolleranza di errore nelle piattaforme cloud
- Informazioni sui servizi di backup offerti dai principali provider di servizi cloud
- Informazioni sul ruolo svolto dai servizi di backup nella reazione e nel ripristino di emergenza
- Spiegare la differenza tra servizi di backup e servizi di ripristino di emergenza
- Elencare gli obiettivi a livello di servizio alla base della pianificazione del ripristino di emergenza
- Elencare i servizi di ripristino di emergenza offerti dai principali provider di servizi cloud
- Spiegare che cos'è la resilienza e come viene misurata
- Spiegare come la resilienza contribuisce alla continuità aziendale
Prerequisiti
- Comprendere cos'è il cloud computing, inclusi i modelli di servizio cloud e i provider di servizi cloud comuni
- Conoscere i diversi tipi di cloud (pubblico, privato, ibrido)
- Come riconoscere i modelli di servizio cloud, ad esempio IaaS, PaaS e SaaS e riuscire a distinguerli
- Comprendere come funziona il provisioning delle risorse cloud
- Comprendere il funzionamento dei data center e la modalità di archiviazione dei dati nel cloud
- Conoscere le basi della sicurezza nel cloud