Sdílet prostřednictvím


Důležité informace o provozní kontinuitě a zotavení po havárii pro Red Hat Enterprise Linux v Azure

Tento článek popisuje, jak zlepšit připravenost provozní kontinuity a zotavení po havárii (BCDR) pro prostředí založené na Red Hat Enterprise Linuxu (RHEL) v Azure. Poskytuje doporučení, která můžete použít k podpoře úloh RHEL a k nasazení komponent pro správu platformy RHEL. Předplatné Red Hat Management obsahuje komponenty platformy, které pomáhají spravovat úlohy v jedné nebo více cílových zónách RHEL. Tyto komponenty nabízejí vlastní konfigurace BCDR.

Aspekty návrhu

Implementujte následující aspekty, které zlepšují odolnost vašich úloh RHEL.

Cíle doby obnovení

Cíl doby obnovení (RTO) je doba, po kterou by měl systém po havárii obnovit do původního stavu. RtO zahrnuje dobu, kterou trvá:

  • Obnovte minimální funkčnost virtuálních počítačů a aplikací.
  • Obnovte data, která aplikace vyžadují.

RtO v obchodních podmínkách představuje dobu, po kterou jsou obchodní procesy mimo provoz. Nízká rto je ideální pro klíčové úlohy , aby obchodní procesy mohly rychle pokračovat. U úloh s nižší prioritou nemusí mít vyšší RTO výrazný vliv na výkon společnosti.

Cíle bodu obnovení

Pokud chcete úspěšně provozovat cloudové prostředí, musíte implementovat zálohy, replikaci nebo obojí, abyste ochránili data před selháními. Cíl bodu obnovení odkazuje na čas posledního zachycení dat. Pokud dojde k selhání systému, můžete ho obnovit pouze do nejnovějšího bodu obnovení.

Změříte cíl bodu obnovení z posledního bodu obnovení do doby, kdy dojde k výpadku. Pokud změříte cíl bodu obnovení v hodinách, dojde k selhání systému ke ztrátě dat po dobu hodin mezi posledním bodem obnovení a výpadkem. Pokud změříte cíl bodu obnovení ve dnech, dojde k selhání systému ke ztrátě dat pro dny mezi posledním bodem obnovení a výpadkem. Jednorázový cíl bodu obnovení teoreticky vede ke ztrátě všech transakcí v den, který vede k selhání.

V případě kritických systémů změřte cíl bodu obnovení v minutách nebo sekundách, abyste se vyhnuli ztrátě výnosů nebo zisku. Krátký cíl bodu obnovení obecně vede ke zvýšení nákladů na správu. Pokud chcete tyto náklady snížit, měli byste vytvořit směrný plán správy, který se zaměřuje na nejdelší přijatelný cíl bodu obnovení. Pak můžete snížit cíl bodu obnovení konkrétních platforem nebo úloh, které zaručují větší investice.

Důležité informace o BCDR pro úlohy

Aspekty návrhu s vysokou dostupností a zotavením po havárii pro úlohy založené na RHEL závisí na technologiích, které tyto úlohy podporují. Řada moderních úloh může využít výhod nativních služeb Azure k zajištění redundance napříč zónami dostupnosti a napříč oblastmi. Pomocí služeb Azure můžete spravovat replikaci dat, automaticky škálovat skupiny dostupnosti a řídit aktualizace a domény selhání. Tyto postupy usnadňují zajištění dostupnosti nasazení RHEL.

Databázová řešení a další stavové aplikace můžou potřebovat řešení zaměřená na operační systém, aby poskytovala vysokou dostupnost a zotavení po havárii. Obraťte se na vývojáře nebo dodavatele aplikací a ověřte řešení, která aplikace podporují. Další informace najdete v tématu Vysoká dostupnost a zotavení po havárii pro aplikace IaaS.

Funkce nebo služba Azure Definice Důležité informace
Oblasti Skupina datacenter, která se nacházejí blízko sebe, aby poskytovala malá zpoždění v síti. Aby se zajistil rychlý přenos dat, připojí konkrétní oblastní síť datacentra. Při výběru oblasti Azure zvažte umístění datacenter, uživatelů a back-endových dat. Zkontrolujte dostupnost služeb, které potřebujete v vybraných oblastech. U nasazení RHEL můžete mít jednu oblast, kterou chcete spustit, a pak můžete přidat další oblasti v budoucnu pro účely BCDR.
Azure ExpressRoute Služba Azure, kterou můžete použít k navázání privátních připojení z datacenter Microsoftu k vaší vlastní infrastruktuře nebo ke kolokaci. ExpressRoute obchází veřejný internet a poskytuje vyhrazené privátní připojení. Tato konfigurace je běžným požadavkem pro rozsáhlá nasazení RHEL. ExpressRoute je sdílená služba, takže potřebujete pečlivě naplánovat kapacitu šířky pásma, aby vyhovovala potřebám vaší organizace na celkovou šířku pásma.

Pokud nemáte dostatečnou šířku pásma, můžete ohrozit uživatelské prostředí nebo přístup k důležitým službám v datacentru. Ujistěte se, že expressRoute nasazujete odolným způsobem napříč oblastmi a umístěními partnerského vztahu.
Zóny dostupnosti Samostatné skupiny datacenter, které mají vlastní napájení, chlazení a síťové systémy v rámci oblasti Azure. Zóny dostupnosti poskytují vysokou dostupnost a odolnost vůči selháním datacentra. K zajištění vysoké smlouvy o úrovni služeb (SLA) používejte zóny dostupnosti s infrastrukturou RHEL, pokud je to možné. Zóny dostupnosti nabízejí redundanci datacentra v rámci oblasti. Ale ne každá oblast má zóny dostupnosti, takže je potřeba pečlivě naplánovat. Služby RHEL, jako je Azure Red Hat OpenShift a služby pro správu cílových zón, podporují zóny dostupnosti.
Skupiny dostupnosti Logické seskupení virtuálních počítačů. Alespoň jeden virtuální počítač je vždy spuštěný během plánovaných nebo neplánovaných událostí údržby. Doména selhání je podmnožinou skupiny dostupnosti, která sdílí společnou fyzickou infrastrukturu, jako je napájení nebo síť. Když distribuujete virtuální počítače mezi různé domény selhání, skupina dostupnosti snižuje dopad selhání hardwaru na dostupnost virtuálního počítače. Skupiny dostupnosti poskytují vysokou smlouvu SLA. Skupiny dostupnosti jsou vhodné pro infrastrukturu RHEL, pokud oblast nemá zóny dostupnosti. Skupiny dostupnosti mají pouze redundanci hardwaru, která se podobá pravidlům anti-spřažení hypervisoru. Pokud tedy vaše oblasti nemají zóny dostupnosti, potřebujete strategii více oblastí pro datacentrum a geografickou redundanci.
Azure Load Balancer Služba vyrovnávání zatížení sítě. Load Balancer můžete nakonfigurovat tak, aby efektivně poskytoval síťový provoz s velkým objemem na více serverech Red Hat Enterprise. Služba funguje s nízkou latencí a vysokou propustností, což zlepšuje výkon a dostupnost aplikací.

Load Balancer se může automaticky škálovat podle poptávky. Aby bylo možné zvýšit úroveň hybridního nasazení aplikací, může Load Balancer distribuovat síťový provoz napříč několika oblastmi v Azure a také mezi místními prostředími a Azure.
Load Balancer distribuuje síťový provoz mezi více serverů, aby poskytoval nepřerušenou dostupnost aplikace a zabránil selhání jednoho bodu. Pokud dojde k havárii, Load Balancer přesměruje provoz na provozní servery, aby poskytoval rychlé převzetí služeb při selhání a obnovení. Tato operace minimalizuje výpadky a udržuje obchodní operace.

Load Balancer může vyrovnávat provoz mezi místními servery do cloudu Azure nebo mezi servery v několika oblastech Azure. Další informace najdete v tématu Možnosti vyrovnávání zatížení.
Spravované disky Virtualizované disky, které Spravuje Azure. Zvolíte velikost a typ disku. Azure distribuuje disky mezi různé jednotky úložiště, aby chránila vaše data před selháním hardwaru. Spravované disky jsou nejlepší volbou pro veškerou infrastrukturu RHEL. Nepoužívejte nespravované disky. Další informace najdete v tématu Sla pro virtuální počítače.

Různé typy disků mají jiný výkon a náklady. Pro počítače infrastruktury RHEL doporučujeme azure Premium SSD. Při výběru typu disku zvažte náklady, výkon a dostupnost. Když zrušíte přidělení systému, odeberou se místní disky SSD a dočasné disky. Podle potřeby zálohujte data na těchto discích.
Azure Backup Služba, která poskytuje nákladově efektivní řešení pro zálohování dat a jejich obnovení z cloudu Azure. Zálohování je spolehlivé a nákladově efektivní řešení, které chrání infrastrukturu RHEL před selháním nebo poškozením virtuálního počítače. Pomocí služby Backup můžete snadno obnovit celý virtuální počítač nebo konkrétní soubory a složky z cloudu, aniž byste museli znovu vytvořit virtuální počítač nebo přijít o žádná data. Můžete také použít další podporovaná partnerová řešení.
Azure Arc Platforma, která rozšiřuje služby Azure tak, aby běžela napříč různými prostředími, včetně datových center, hraničních zařízení a architektur s více cloudy. Azure Arc slouží k zajištění konzistentního vývoje, provozu a správy zabezpečení pro aplikace a služby. Využijte Azure Arc k implementaci centralizovaných automatizovaných záloh a monitorování, které zvyšuje odolnost z hlediska BCDR.
Azure Site Recovery Služba, která poskytuje možnosti zotavení po havárii, aby se zajistila kontinuita podnikových procesů. Úlohy můžete replikovat a spravovat, včetně virtuálních počítačů Azure a místních virtuálních počítačů, napříč různými oblastmi. Pomocí Site Recovery můžete nastavit procesy replikace, převzetí služeb při selhání a obnovení, které zajistí ochranu aplikací během plánovaných výpadků a neplánovaných výpadků. Pomocí Site Recovery můžete minimalizovat problémy s obnovením, snížit náklady na infrastrukturu a zajistit zabezpečené a spolehlivé obnovení mezi oblastmi Azure nebo z místních umístění do Azure.
Zámky prostředků Funkce Azure, kterou můžete použít k omezení uživatelů a rolí ve vaší organizaci. Chraňte důležité prostředky před náhodnými nebo škodlivými změnami. Prostředek můžete uzamknout na různých úrovních rozsahu, jako je předplatné, skupina prostředků nebo jednotlivé úrovně prostředků. V závislosti na typu zámku můžete uživatelům zabránit v odstranění nebo úpravě prostředku, ale přesto můžou číst jeho konfiguraci. K ochraně všech virtuálních počítačů RHEL a zlatých imagí použijte zámky prostředků. Pokud chcete zabránit náhodné ztrátě důležitých počítačů, použijte zámek Odstranit minimálně. Použijte zámek ReadOnly na počítače infrastruktury RHEL, protože se často nemění. Proveďte změny pouze během odpovídajících oken ovládacího prvku změn.

Důležité informace o BCDR platformy RHEL

Další informace o možnostech BCDR pro infrastrukturu platformy RHEL najdete tady:

Doporučení k návrhu

Pro aplikace nativní pro cloud v kontejnerech Linuxu použijte platformu založenou na Kubernetes, která zajišťuje škálovatelnost, vysokou dostupnost a redundanci. Zvažte použití platformy Azure Red Hat OpenShift nebo samoobslužného nasazení OpenShift s replikovaným nebo geograficky replikovaným úložištěm.

Pro front-endy nativních webových aplikací a bezstavové aplikace můžete použít mnoho nativních služeb Azure, které poskytují dostupnost aplikací. Architektury, které tyto služby používají, najdete v těchto tématech:

Předchozí architektury používají pro zóny dostupnosti různé služby Azure. Architektura s více oblastmi používá funkce geografické replikace pro obsah a Azure Front Door jako službu vyrovnávání zatížení.

Pro mnoho tradičních stavových aplikací, které vyžadují vysokou dostupnost, nabízí RHEL doplněk s vysokou dostupností Pacemaker. Můžete získat systémy, které mají tuto funkci z Azure Marketplace, nebo můžete nasadit vlastní image s vloženými požadovanými softwarovými komponentami. Další informace najdete v tématu Konfigurace clusteru s vysokou dostupností Red Hat v Microsoft Azure.

Problémy s dostupností ovlivňují výpadky služeb a dobu odezvy služeb. Může dojít ke snížení výkonu služeb, což může snížit výkon služeb zákazníka. Abyste zajistili, že budete udržovat úrovně výkonu a dostatečnou kapacitu v rámci požadovaných oblastí, použijte funkci rezervace kapacity Azure na vyžádání.

Spolehlivost

Mnoho konceptů, které platí pro infrastrukturu jako infrastrukturu virtuálních počítačů služeb, platí také pro architektury RHEL. Další informace najdete v tématu Principy návrhu spolehlivosti.

Clustery

Azure nepodporuje kombinování aplikačních serverů Central Services a vysoké dostupnosti databáze v rámci jednoho clusteru RHEL Pacemaker. Pokud chcete toto omezení vyřešit, oddělte je do jednotlivých clusterů. V páru virtuálních počítačů můžete kombinovat až pět clusterů centrálních služeb.

V případě BCDR v SYSTÉMU SAP zvažte následující služby pro spouštění clusterů centrálních služeb SAP:

  • Cluster RHEL Pacemaker: Bloková zařízení STONITH se nepodporují, ale můžete se spolehnout na agenta plotu Azure.
  • Software clusteru s certifikací SAP, který není microsoftem: Prozkoumejte tuto možnost, pokud je v souladu s vašimi požadavky.

Zvolte příslušnou službu na základě vašich konkrétních potřeb a operačního systému.

Další informace naleznete v tématu:

Galerii výpočetních prostředků můžete použít k ukládání zlatých imagí pro nasazení. Tyto image použijte k zotavení po havárii aplikací a nástrojů. Galerie výpočetních prostředků může používat vysoce dostupné prostředky s účty zónově redundantního úložiště (ZRS) v oblastech, které podporují zóny dostupnosti. ZRS nabízí odolnost proti zónovým selháním. Image galerie můžete také replikovat do jiných oblastí nebo geografických oblastí.

Poznámka:

Doporučujeme mít aspoň dvě galerie v různých oblastech.

Site Recovery

Site Recovery může zvýšit odolnost některých komponent RHEL. Seznam podporovaných serverů RHEL Site Recovery najdete v matici podpory pro zotavení po havárii virtuálního počítače Azure pomocí Site Recovery. Site Recovery můžete také nastavit jako převzetí služeb při selhání z místních prostředí do cloudu. Pokud chcete získat odhad nákladů na Site Recovery, použijte Plánovač nasazení Site Recovery.

Uzly clusteru pro obnovení

Pokud chcete snížit rtO a zvýšit odolnost, můžete použít aktivní nebo pohotovostní uzly clusteru pro vzdálené obnovení. Položky clusteru pro zotavení po havárii musíte nakonfigurovat ručně. Musíte například použít konfigurace pro nastavení prostředků a kopírování dat.

Další kroky