Ta fram en plan för affärskontinuitet och haveriberedskap
Organisationen vill att du utformar en webbplatsåterställningsstrategi för dina program. Först bör du förstå de specifika kraven för att skapa platsåterställning för din hybridmiljö. Du måste också förstå vilka verktyg som är tillgängliga i Azure för att hjälpa dig.
I den här lektionen får du lära dig hur du identifierar viktiga infrastrukturer, mål för återställningstid (RTO) och mål för återställningspunkter (RPO). Du får lära dig vilka krav som kan vara relevanta för alla PaaS-tjänster (Plattform som en tjänst) som du kanske använder. Du får också lära dig hur du planerar för säkerhetskopiering och haveriberedskap. Slutligen upptäcker du några av de Azure-funktioner som hjälper dig att skapa en lösning för webbplatsåterställning.
Affärskontinuitet och haveriberedskap
Du måste utveckla en BCDR-plan för att utforma en lämplig platsåterställningslösning. BCDR refererar till en process som hjälper dig att återställa dina program till ett funktionellt tillstånd efter en betydande händelse. Den här händelsen kan vara en naturkatastrof, till exempel en jordbävning. Eller så kan det vara tekniskt, till exempel borttagning av en databas. Dessa händelser är vanligtvis bredare i omfånget och innebär större ansträngningar att återställa från.
För att kunna utforma en lyckad haveriberedskapsprocess måste du först utvärdera vilken typ av affärspåverkan eventuella fel kan ha. Överväg att automatisera återställningsprocessen i största möjliga utsträckning. Vissa delar av haveriberedskapsprocessen omfattar oundvikligen mänsklig indata, så du måste dokumentera processen fullt ut. Du måste också regelbundet simulera katastrofer så att återställningsprocessen förblir effektiv.
Identifiera viktiga intressenter och viktig infrastruktur
Identifiera alla som har ett intresse av att programmen alltid fungerar som de ska. Dessa intressenter kan vara externa eller interna användare. Din supportpersonal och alla som krävs för manuella indata i BCDR-processen är en intressent. Andra program och tjänster som förlitar sig på dina program kan också vara intressenter.
Identifiera infrastrukturen som utgör miljön för dina program. Den här infrastrukturen är vanligtvis virtuella datorer , nätverksresurser, lagringsresurser och andra tjänster som körs tillsammans med dessa resurser.
Identifiera mål för återställningspunkt och mål för återställningstid
Ett RPO representerar hur mycket dataförlust som är acceptabelt för ditt program om det uppstår en katastrof. Om det till exempel uppstår avbrott för ditt program kanske du anser att det endast är acceptabelt att programmet körs med data som är mindre än en halvtimme gamla efter återställning. Vissa program kan fungera med äldre data, men för andra är det viktigt att så nya data som möjligt används.
En RTO är den maximala varaktigheten för acceptabel stilleståndstid för ditt program. Du kan till exempel tycka att det är oacceptabelt att programmet är nere längre än fyra timmar på grund av den potentiella förlusten för företaget som skulle medföra ett längre avbrott. Kritiska program kräver en kortare RTO.
Avtalsmässiga eller regelmässiga krav kan ofta påverka RPO och RTO för ditt program. RPO och RTO kan också variera per program. Mindre kritiska program kan ha större värden för RPO och RTO, medan affärskritiska program kan ha en mindre tolerans för stilleståndstid och dataförlust. Du beräknar RTO och RPO baserat på organisationens förståelse av risken och kostnaden för driftstopp och dataförlust.
Identifiera eventuella PaaS-krav
Även om du kanske har kontroll över stilleståndstid och återställning för de program som du hanterar kanske du inte har samma kontroll över PaaS-tjänster. Alla PaaS-tjänster som du använder kan ha egna tillgänglighetsgarantier och återställningsplaner som du måste överväga i din BCDR-plan.
Identifiera och inventera de tjänster som du är beroende av, så att du kan införliva deras återställningsfunktioner i din BCDR-plan. Det är viktigt att förstå relevanta krav och hur de påverkar BCDR-processen.
Azure Site Recovery
Azure Site Recovery är en tjänst som tillhandahåller BCDR-funktioner för dina program i Azure, lokalt och hos andra molnleverantörer. Site Recovery har planer som hjälper dig att automatisera haveriberedskapen. Det gör att du kan definiera hur datorer rededs över och i vilken ordning de startas om när de har redväxlades. På så sätt hjälper Site Recovery till att automatisera uppgifter och ytterligare minska din RTO. Du kan också använda Site Recovery för att regelbundet testa redundansväxlingar och den övergripande effektiviteten i återställningsprocessen.
Säkerhetskopior av data
Säkerhetskopior hjälper till att skydda program från oavsiktlig borttagning eller skada av data. De spelar en viktig roll i alla BCDR-planer.
Ditt RPO beror på hur ofta och hur regelbundet du kör säkerhetskopieringsprocesser. Om du till exempel har en säkerhetskopieringsprocess som är konfigurerad att köras varannan timme och du drabbas av en katastrof fem minuter före nästa säkerhetskopiering förlorar du en timme och 55 minuters data. En mer frekvent säkerhetskopiering innebär ett kortare mål för återställningspunkt. Du måste ta med en detaljerad säkerhetskopieringsprocess i din övergripande plan.
Du kan använda Azure Backup för säkerhetskopieringsprocessen. Azure Backup-tjänsten tillhandahåller säker säkerhetskopiering för alla Azure-hanterade datatillgångar. Den använder nollinfrastrukturlösningar för att aktivera självbetjäningssäkerhetskopior och återställningar, med skalbar hantering till en förutsägbar kostnad.
Azure Backup erbjuder specialiserade säkerhetskopieringslösningar för virtuella Azure-datorer och lokala virtuella datorer. Azure Backup gör det också möjligt för arbetsbelastningar som SQL Server eller SAP HANA som körs på virtuella Azure-datorer att ha säkerhetskopierings- och återställningsalternativ i företagsklass.
Både Azure Backup och Azure Site Recovery syftar till att göra systemet mer motståndskraftigt mot fel och fel. Det primära målet med Azure Backup är dock att underhålla kopior av tillståndskänsliga data som gör att du kan gå tillbaka i tiden. Site Recovery replikerar data i nästan realtid och möjliggör en redundansväxling. Läs mer om Azure Backup.
Återhämtningsfunktioner i Azure
Azure har flera funktioner som hjälper dig att säkerställa att dina program och din infrastruktur är motståndskraftiga. Azures motståndskraftsfunktioner omfattar regionparning, tillgänglighetsuppsättningar och tillgänglighetszoner.
Parkoppling av regioner
Alla Azure-regioner är parkopplade med en annan region. I ett regionpar uppdateras aldrig regionerna samtidigt. I stället uppdateras de en i taget. Om något händer med en region blir den andra regionen i paret tillgänglig.
Regionparen används också för replikering. Lagringstjänster och många PaaS-tjänster replikeras och har redundanspar i den parkopplade regionen. Som en del av din BCDR-planering är det viktigt att använda regionparkoppling för att dra nytta av den isolering som den tillhandahåller. Du kan minska den tid det tar att återställa efter ett fel och öka tillgängligheten.
Tillgänglighetsuppsättningar
En tillgänglighetsuppsättning är en logisk grupperingsfunktion i Azure. Du kan placera vm-resurser i en tillgänglighetsuppsättning för att säkerställa att de virtuella datorresurserna isoleras från varandra när de distribueras i ett Azure-datacenter. Tillgänglighetsuppsättningar består av uppdateringsdomäner och feldomäner.
Uppdateringsdomäner hjälper till att säkerställa att en delmängd av programmets servrar fortsätter att köras när de virtuella datorvärdarna i ett Azure-datacenter kräver driftstopp för underhåll. De flesta uppdateringar av vm-värdar kan utföras utan att påverka de virtuella datorer som körs på dem, men det finns tillfällen då den här typen av uppdatering inte är möjlig.
För att se till att uppdateringar inte sker för alla virtuella datorer samtidigt delas Azure-datacentret upp logiskt i uppdateringsdomäner. När en underhållshändelse inträffar, till exempel en prestandauppdatering och en kritisk säkerhetskorrigering som måste tillämpas på värden, sekvenseras underhållshändelsen via uppdateringsdomäner. Användningen av sekvensering via uppdateringsdomäner säkerställer att hela datacentret inte är otillgängligt under plattformsuppdateringar och korrigeringar.
Feldomäner representerar fysiska delar av datacentret och hjälper till att säkerställa flera olika servrar i en tillgänglighetsuppsättning. Feldomäner överensstämmer med den fysiska separationen av delad maskinvara i datacentret. Delad maskinvara omfattar energi, kylning och nätverksmaskinvara som stöder de fysiska servrarna på serverrack.
Om maskinvaran som stöder ett serverrack blir otillgänglig påverkar driftstoppet endast serverracket. När du placerar dina virtuella datorer i en tillgänglighetsuppsättning sprids de automatiskt över flera feldomäner. Om ett maskinvarufel inträffar påverkar det bara vissa av dina virtuella datorer.
Tillgänglighetszoner
Tillgänglighetszoner är oberoende fysiska datacenterplatser i en region. Tillgänglighetszoner inkluderar sin egen ström, kylning och nätverk. När du tar hänsyn till tillgänglighetszoner när du distribuerar resurser kan du skydda arbetsbelastningar från datacenterstopp samtidigt som du behåller närvaro i en region.
Zonindeliga tjänster är tjänster (till exempel virtuella datorer) som du kan distribuera till specifika zoner i en region. Andra tjänster är zonredundanta tjänster och replikerar mellan tillgänglighetszonerna i den specifika Azure-regionen. Båda typerna hjälper till att säkerställa att det inte finns några enskilda felpunkter i en Azure-region.