Översikt
Den här serien innehåller ett illustrativt exempel på hur en organisation kan utforma en strategi för haveriberedskap (DR) för en Azure Enterprise-dataplattform.
- Den här serien med artiklar kompletterar vägledningen från Microsofts Cloud Adoption Framework, Azure Well-Architected Framework och Business Continuity Management.
Azure tillhandahåller ett brett utbud av återhämtningsalternativ som kan ge tjänstkontinuitet i händelse av en katastrof. Men högre servicenivåer kan medföra komplexitet och en kostnadspremie. Kompromissen mellan kostnad och återhämtning jämfört med komplexitet är den viktigaste beslutsfaktorn för de flesta kunder när det gäller dr.
Ibland uppstår punktfel på Azure-plattformen, men Microsofts Azure-datacenter och Azure-tjänster har flera lager med inbyggd redundans. Eventuella fel är normalt begränsade i omfånget och åtgärdas vanligtvis inom några timmar. Historiskt sett är det mycket mer troligt att en nyckeltjänst som identitetshantering upplever ett tjänstproblem i stället för att en hel Azure-region går offline.
Det bör också erkännas att cyberattacker, särskilt utpressningstrojaner, nu utgör ett påtagligt hot mot alla moderna dataekosystem och kan leda till ett avbrott i dataplattformen. Även om detta ligger utanför omfånget för den här serien rekommenderar vi att kunderna implementerar kontroller mot sådana attacker som en del av en dataplattforms säkerhets- och återhämtningsdesign.
- Microsofts vägledning om skydd mot utpressningstrojaner finns i grunderna för Azure Cloud
Omfattning
Omfånget för den här artikelserien omfattar:
- Tjänståterställning av en Azure-dataplattform från en fysisk katastrof för en illustrativ persona för kunden. Den här illustrativa kunden är:
- En medelstor organisation med en definierad funktion för driftstöd enligt en ITIL-baserad tjänsthanteringsmetod (Information Technology Infrastructure Library).
- Inte molnbaserat, med dess kärnföretag, delade tjänster som åtkomst- och autentiseringshantering och incidenthantering kvar lokalt.
- På resan för molnmigrering till Azure, aktiverad av automatisering.
- Azure-dataplattformen har implementerat följande design i kundens Azure-innehav:
- Landningszon för företag – Tillhandahålla plattformens grund, inklusive nätverk, övervakning, säkerhet och så vidare.
- Azure Analytics-plattform – Tillhandahålla de datakomponenter som stöder de olika lösningar och dataprodukter som tillhandahålls av tjänsten.
- Processerna som beskrivs i den här artikeln kommer att köras av en teknisk Azure-resurs i stället för en expert på Azure-ämnen (SME). Resurserna bör därför ha följande kunskap/kompetensnivå:
- Grunderna i Azure – arbetskunskaper om Azure, dess kärntjänster och datakomponenter.
- Arbetskunskaper om Azure DevOps. Du kan navigera i källkontrollen och köra pipelinedistributioner.
- De här processerna som beskrivs i den här artikeln beskriver redundansåtgärder för tjänster, från den primära till den sekundära regionen.
Omfattas ej
Följande objekt anses vara out-of-scope för den här artikelserien:
- Återställningsprocessen, från den sekundära regionen tillbaka till den primära regionen.
- Alla icke-Azure-program, komponenter eller system – detta inkluderar men är inte begränsat till lokala, andra molnleverantörer, webbtjänster från tredje part och så vidare.
- Återställning av överordnade tjänster, till exempel lokala nätverk, gatewayer, företagsdelade tjänster och andra, oavsett beroenden för dessa tjänster.
- Återställning av underordnade tjänster, till exempel lokala driftsystem, rapporteringssystem från tredje part, datamodellering eller datavetenskapsprogram och andra, oavsett beroenden för dessa tjänster.
- Dataförlustscenarier, inklusive återställning från utpressningstrojaner eller liknande datasäkerhetsincidenter
- Strategier för säkerhetskopiering av data och planer för dataåterställning
- Upprättar rotorsaken till en DR-händelse.
- För Azure-tjänst-/komponentincidenter publicerar Microsoft en "rotorsaksanalys" på webbsidan Status – historik
Viktiga antaganden
De viktigaste antagandena för det här dr-arbetsexemplet är:
- Organisationen följer en ITIL-baserad tjänsthanteringsmetod för driftstöd för Azure-dataplattformen.
- Organisationen har en befintlig haveriberedskapsprocess som en del av sitt tjänståterställningsramverk för IT-tillgångar.
- Infrastruktur som kod (IaC) har använts för att distribuera Azure-dataplattformen som aktiveras av en automationstjänst, till exempel Azure DevOps eller liknande.
- Varje lösning som hanteras av Azure-dataplattformen har slutfört en utvärdering av affärspåverkan eller liknande, vilket ger tydliga tjänstkrav för mål för återställningspunkt (RPO), mål för återställningstid (RTO) och genomsnittlig tid för återställning (MTTR).
Nästa steg
Nu när du har lärt dig om scenariot på hög nivå kan du gå vidare för att lära dig mer om arkitekturen som är utformad för användningsfallet.