Responsabilità condivisa per la resilienza
Nella piattaforma cloud pubblico di Azure la resilienza è una responsabilità condivisa tra Microsoft e l'utente. Poiché in ogni carico di lavoro si progettano e distribuiscono diversi livelli di resilienza, è importante comprendere chi ha la responsabilità principale per ognuno di questi livelli dal punto di vista della resilienza.
Per comprendere meglio il funzionamento della responsabilità condivisa, soprattutto quando si affronta un'interruzione o un'emergenza, questo articolo descrive il modello di responsabilità condivisa per la resilienza. Per altre informazioni su come usare effettivamente questo modello per pianificare il ripristino di emergenza, vedere Raccomandazioni per la progettazione di una strategia di ripristino di emergenza.
Modello di responsabilità condivisa per la resilienza
Il modello di responsabilità condivisa per la resilienza è costituito da tre livelli:
- Affidabilità della piattaforma principale. La piattaforma Azure offre un livello di affidabilità di base per tutti i clienti e tutti i servizi tramite l'infrastruttura, i servizi e i processi sottostanti.
- Le funzionalità di miglioramento della resilienza di Azure offrono una suite di funzionalità e servizi predefiniti che migliorano la resilienza, ad esempio l'uso delle zone di disponibilità, la distribuzione in più aree e l'implementazione di strategie di backup. Anche se Azure offre queste funzionalità, è responsabilità dell'utente valutarle e configurarle per allinearle ai requisiti specifici. I requisiti possono includere affidabilità, costi, prestazioni e conformità con gli standard normativi.
- Applicazioni. Per usare efficacemente gli altri livelli, l'applicazione e il carico di lavoro devono essere progettati per la resilienza.
Microsoft è responsabile esclusivamente dell'affidabilità della piattaforma principale. Microsoft è anche responsabile della fornitura di funzionalità di miglioramento della resilienza che è possibile usare. L'utente è responsabile della selezione e dell'uso dei componenti appropriati.
Indipendentemente dal fatto che si scelgano categorie di servizi SaaS, PaaS o IaaS, determina il tipo di decisioni prese. Ad esempio, se si usa un servizio SaaS, in genere non è necessario acconsentire esplicitamente all'uso delle zone di disponibilità. Se si usano servizi PaaS per il livello dati, è possibile che siano disponibili funzionalità automatizzate per il backup. Se si usano i servizi IaaS, in genere è necessario pianificare e implementare molte funzionalità di resilienza manualmente.
Nota
Le categorie di servizio (SaaS, PaaS e IaaS) sono utili come un ampio raggruppamento di servizi, ma è importante comprendere le responsabilità per ogni singolo servizio usato.
Le guide all'affidabilità offrono una panoramica del funzionamento di ogni servizio dal punto di vista della resilienza e consentono di prendere decisioni informate su come configurare i servizi per soddisfare le esigenze.
Si è anche responsabili della progettazione dell'applicazione e del carico di lavoro e della definizione dei requisiti di affidabilità, che consentono di decidere come progettare e configurare la soluzione.
Affidabilità della piattaforma principale
La piattaforma cloud Microsoft è costituita da una grande quantità di infrastruttura, hardware, software e processi per supportare la distribuzione e la gestione dei servizi. Ogni componente è progettato per essere altamente resiliente, con più ridondanze per l'hardware e con processi software basati sulla ricerca. Insieme, questi componenti costituiscono il livello di affidabilità della piattaforma principale. Di seguito sono riportati alcuni esempi di come Microsoft fornisce una piattaforma affidabile:
- Le reti hanno collegamenti ridondanti e possono ignorare dinamicamente i segmenti difettosi.
- All'interno di ogni area, i data center sono connessi tramite una rete a bassa latenza, che consente un'ampia gamma di approcci alla replica dei dati.
- Le strutture dei data center hanno connessioni di rete, raffreddamento e alimentazione ridondanti. Sono gestiti da team in loco che proteggono, monitorano e gestiscono loro.
- L'hardware, inclusi i cluster e i rack, ha ridondanza a più livelli.
- Gli aggiornamenti ai cluster di calcolo, ai rack e agli host seguono un processo controllato. Vengono usate tecniche come hotpatching per ridurre o eliminare l'impatto sugli host.
- Gli aggiornamenti della piattaforma software e le modifiche alla configurazione vengono applicati seguendo le procedure di distribuzione sicure.
- Microsoft controlla i fornitori esterni critici per garantire che un'interruzione del servizio di terze parti non interrompa i servizi di Azure.
- Ogni servizio di Azure deve avere un piano di ripristino di emergenza dettagliato. Vengono condotte esercitazioni complete in aree che corrispondono agli ambienti di produzione.
Tutti i servizi di Azure traggono vantaggio da queste funzionalità di affidabilità della piattaforma di base e con i miglioramenti continui apportati da Microsoft.
Funzionalità di miglioramento della resilienza
Azure offre molte funzionalità di miglioramento della resilienza diverse. Anche se Microsoft è responsabile della fornitura di queste funzionalità, l'utente è interamente responsabile della selezione e dell'uso di quelli appropriati per le proprie esigenze. Alcuni esempi di queste funzionalità includono:
Aree. Azure include più di 60 aree ed è possibile usare più aree in un'unica soluzione per ottenere la ridondanza geografica, soddisfare le esigenze di residenza dei dati e abilitare la comunicazione a bassa latenza agli utenti a livello globale. Per altre informazioni sulle aree, vedere Che cosa sono le aree di Azure?
Zone di disponibilità. Molte aree di Azure supportano le zone di disponibilità, che consentono di distribuire i carichi di lavoro in più set indipendenti di data center. I servizi di Azure supportano le zone di disponibilità in modo appropriato allo scopo previsto, in genere supportando distribuzioni di zona (aggiunte a una singola zona) e/o distribuzioni con ridondanza della zona (distribuite tra più zone). Per altre informazioni sulle zone di disponibilità, vedere Che cosa sono le zone di disponibilità?
Livelli di servizio. I servizi offrono un'ampia gamma di offerte e livelli che soddisfano requisiti diversi. Ad esempio, quando si crea una macchina virtuale, è possibile scegliere tra un disco standard, che offre un'opzione a basso costo o un disco Premium per ottenere un livello di disponibilità superiore.
Backup. Molti servizi di Azure che archivia i dati supportano i backup, che potrebbero essere automatici, manuali o entrambi. Con i backup, è possibile proteggere il carico di lavoro da interruzioni, nonché dal danneggiamento dei dati e da altri eventi di perdita di dati.
Governance. Le funzionalità della piattaforma, ad esempio Criteri di Azure, il controllo degli accessi in base al ruolo e le funzionalità di protezione delle identità dell'ID Microsoft Entra, possono essere configurate per applicare in modo coerente i requisiti dell'organizzazione. Con questi approcci è possibile proteggere i carichi di lavoro da eventi imprevisti di sicurezza e modifiche accidentali che potrebbero causare tempi di inattività o altri problemi con il carico di lavoro.
Importante
È importante comprendere i contratti di servizio per ogni servizio di Azure. I contratti di servizio forniscono informazioni importanti sul tempo di attività previsto del servizio e sulle eventuali condizioni che è necessario soddisfare per essere idonei per il contratto di servizio. Per i contratti di servizio per ogni servizio, vedere Contratti di servizio (SLA) per i servizi online.
Applicazioni
È responsabilità dell'utente assicurarsi che le applicazioni siano progettate per essere resilienti. Usare i pilastri di Azure Well-Architected Framework per favorire l'eccellenza dell'architettura a livello fondamentale di un carico di lavoro. Il pilastro dell'affidabilità è incentrato su come rendere resilienti il carico di lavoro e le applicazioni a diversi tipi di errori e abilitare il ripristino in caso di errori.
Passaggi successivi
Il modello di responsabilità condivisa si applica ad altre parti della soluzione oltre la resilienza. Per altre informazioni sul modello di responsabilità condivisa per la sicurezza, vedere Centro protezione Microsoft.