Spolehlivost privátního 5G jádra Azure
Tento článek popisuje podporu spolehlivosti ve službě Azure Private 5G Core. Týká se regionální odolnosti se zónami dostupnosti a zotavením po havárii mezi oblastmi a provozní kontinuitou. Přehled spolehlivosti v Azure najdete v tématu Spolehlivost Azure.
Službu Azure Private 5G Core můžete nasadit také jako službu s vysokou dostupností (HA) na pár zařízení Azure Stack Edge (ASE). Další informace najdete v tématu Dokončení požadovaných úloh pro nasazení privátní mobilní sítě.
Podpora zón dostupnosti
Zóny dostupnosti jsou fyzicky oddělené skupiny datacenter v rámci každé oblasti Azure. Když jedna zóna selže, můžou služby převzít služby při selhání jedné ze zbývajících zón.
Další informace o zónách dostupnosti v Azure najdete v tématu Co jsou zóny dostupnosti?.
Služba Azure Private 5G Core se automaticky nasadí jako zónově redundantní v oblastech Azure, které podporují zóny dostupnosti, jak je uvedeno v oblastech Azure s podporou zóny dostupnosti. Pokud oblast podporuje zóny dostupnosti, všechny prostředky Azure Private 5G Core vytvořené v oblasti je možné spravovat z libovolné zóny dostupnosti.
Ke konfiguraci nebo správě zón dostupnosti se nevyžaduje žádná další práce. Převzetí služeb při selhání mezi zónami dostupnosti je automatické.
Požadavky
Pro oblasti Azure, ve kterých je k dispozici privátní 5G Core Azure, najdete informace o produktech dostupných v jednotlivých oblastech .
Prostředí pro zónu dolů
Ve scénáři výpadku na úrovni zóny by uživatelé neměli mít žádný dopad, protože služba se přesune, aby automaticky využila výhod zóny, která je v pořádku. Na začátku výpadku na úrovni zóny se může zobrazit probíhající vypršení časového limitu požadavků ARM nebo selhání. Nové požadavky budou směrovány na uzly v pořádku s nulovým dopadem na uživatele a všechny neúspěšné operace by se měly opakovat. Během výpadku budete moct vytvářet nové prostředky a aktualizovat, monitorovat a spravovat existující prostředky.
Techniky bezpečného nasazení
Aplikace zajišťuje, že se veškerý stav cloudu replikuje mezi zónami dostupnosti v dané oblasti, takže všechny operace správy budou pokračovat bez přerušení. Jádro paketů běží na Edgi a nemá vliv na selhání zóny, takže bude dál poskytovat službu uživatelům.
Zotavení po havárii napříč oblastmi a provozní kontinuita
Zotavení po havárii (DR) se týká zotavení z událostí s vysokým dopadem, jako jsou přírodní katastrofy nebo neúspěšná nasazení, která vedou k výpadkům a ztrátě dat. Bez ohledu na příčinu je nejlepším řešením havárie dobře definovaný a otestovaný plán zotavení po havárii a návrh aplikace, který aktivně podporuje zotavení po havárii. Než začnete přemýšlet o vytvoření plánu zotavení po havárii, přečtěte si doporučení pro návrh strategie zotavení po havárii.
Pokud jde o zotavení po havárii, Microsoft používá model sdílené odpovědnosti. V modelu sdílené odpovědnosti Microsoft zajišťuje, aby byly dostupné základní služby infrastruktury a platformy. Současně mnoho služeb Azure automaticky nereplikuje data nebo se vrátí z oblasti, která selhala, aby se křížově replikovala do jiné povolené oblasti. Za tyto služby zodpovídáte za nastavení plánu zotavení po havárii, který funguje pro vaši úlohu. Většina služeb, které běží na nabídkách PaaS (Platforma jako služba) Azure, poskytuje funkce a pokyny pro podporu zotavení po havárii a pomocí funkcí specifických pro služby můžete podporovat rychlé obnovení , které vám pomůže s vývojem plánu zotavení po havárii.
Azure Private 5G Core je k dispozici pouze v geografických oblastech s více oblastmi (3+N). Služba automaticky replikuje přihlašovací údaje SIM karty do oblasti zálohování ve stejné zeměpisné oblasti. To znamená, že v případě selhání oblasti nedojde ke ztrátě dat. Během čtyř hodin od selhání jsou všechny prostředky v oblasti, které selhaly, k dispozici pro zobrazení prostřednictvím webu Azure Portal a nástrojů ARM, ale budou jen pro čtení, dokud se neobnoví oblast, která selhala. Jádro paketů spuštěné v Edgi nadále funguje bez přerušení a bude zachováno síťové připojení.
Microsoft zodpovídá za detekci výpadků, oznámení a podporu aspektů cloudu Azure služby Azure Private 5G Core.
Detekce výpadků, oznámení a správa
Microsoft monitoruje základní prostředky poskytující službu Azure Private 5G Core v každé oblasti. Pokud se tyto prostředky začnou zobrazovat selhání nebo výstrahy monitorování stavu, které nejsou omezeny na jednu zónu dostupnosti, Microsoft přesune službu do jiné podporované oblasti ve stejné zeměpisné oblasti. Jedná se o model aktivní-aktivní. Stav služby pro konkrétní oblast najdete ve službě Azure Service Health (Privátní jádro Azure 5G Core je uvedené v části Sítě ). Dostanete oznámení o všech selháních oblastí prostřednictvím normálních komunikačních kanálů Azure.
Služba automaticky replikuje přihlašovací údaje sim karty vlastněné službou do oblasti zálohování pomocí zápisů do více oblastí služby Cosmos DB, takže v případě selhání oblasti nedojde ke ztrátě dat.
Prostředky Azure Private 5G Core nasazené v oblasti, které selhaly, se stanou jen pro čtení, ale prostředky ve všech ostatních oblastech budou dál fungovat bez ovlivnění. Pokud potřebujete mít možnost zapisovat prostředky vždy, postupujte podle pokynů v tématu Nastavení zotavení po havárii a detekce výpadků a proveďte vlastní operaci zotavení po havárii a nastavte službu v jiné oblasti.
Jádro paketů spuštěné v Edgi nadále funguje bez přerušení a bude zachováno síťové připojení.
Nastavení detekce zotavení po havárii a výpadku
Tato část popisuje, jakou akci můžete provést, abyste měli v případě selhání oblasti plně aktivní rovinu správy pro službu Azure Private 5G Core. To se vyžaduje, pokud chcete mít možnost upravit prostředky v případě selhání oblasti.
Mějte na paměti, že to způsobí výpadek služby jádra paketů a přeruší síťové připojení k vašim uživatelským prostředím až osm hodin, takže tento postup doporučujeme použít jenom v případě, že máte důležitý obchodní důvod ke správě prostředků, zatímco oblast Azure je mimo provoz.
Před událostí zotavení po havárii je nutné zálohovat konfiguraci prostředku do jiné oblasti, která podporuje privátní jádro Azure 5G. Pokud dojde k selhání oblasti, můžete znovu nasadit jádro paketů pomocí prostředků ve vaší oblasti zálohování.
Příprava
Existují dva typy konfiguračních dat Azure Private 5G Core, která je potřeba zálohovat pro zotavení po havárii: konfiguraci mobilní sítě a přihlašovací údaje SIM karty. Doporučený postup:
- Aktualizujte přihlašovací údaje SIM karty v oblasti zálohování pokaždé, když do primární oblasti přidáte nové SIM.
- Zálohujte konfiguraci mobilní sítě alespoň jednou týdně nebo častěji, pokud provádíte časté nebo velké změny konfigurace, například vytvoření nové lokality.
Konfigurace mobilní sítě
Podle pokynů v části Přesun prostředků do jiné oblasti exportujte konfiguraci prostředků Azure Private 5G Core a nahrajte ji do nové oblasti. Doporučujeme pro konfiguraci zálohování použít novou skupinu prostředků, abyste ji jasně oddělili od aktivní konfigurace. Aby se prostředky v primární oblasti odlišily od prostředků, musíte jim dát nové názvy. Tato nová oblast je pasivní zálohování, takže abyste se vyhnuli konfliktům, nesmíte s hraničním hardwarem propojit konfiguraci jádra paketů. Místo toho uložte hodnoty z pole packetCoreControlPlanes.platform pro každé jádro paketů do bezpečného umístění, ke kterému může přistupovat kdokoli, kdo provede proceduru obnovení (například účet úložiště, na který odkazuje interní dokumentace).
Sim data
Z bezpečnostníchdůvodůch Proto není možné exportovat konfiguraci SIM karty stejným způsobem jako jiné prostředky Azure. Doporučujeme, aby se při každém přidání nových SIM do primární služby přidaly stejné SIM také do služby zálohování opakováním procesu zřizování nových SIM pro mobilní síť zálohování.
Další prostředky
Vaše nasazení Azure Private 5G Core může využívat služby Azure Key Vault k ukládání šifrovacích klíčů SIM nebo certifikátů HTTPS pro místní monitorování. Pokud chcete zajistit, aby vaše klíče a certifikáty byly dostupné v oblasti zálohování, musíte postupovat podle dokumentace ke službě Azure Key Vault.
Obnovovací
V případě selhání oblasti nejprve ověřte, že jsou k dispozici všechny prostředky ve vaší zálohované oblasti pomocí dotazu na konfiguraci prostřednictvím webu Azure Portal nebo rozhraní API (viz Přesun prostředků do jiné oblasti). Pokud nejsou k dispozici všechny prostředky, zastavte se tady a nesplňte zbývající část tohoto postupu. Možná nebudete moct obnovit službu v hraniční lokalitě bez konfigurace prostředků.
Proces obnovení je rozdělený do tří fází pro každé jádro paketů:
- Odpojení zařízení Azure Stack Edge od neúspěšné oblasti provedením resetování
- Připojení zařízení Azure Stack Edge k oblasti zálohování
- Přeinstalujte a ověřte instalaci.
Tento proces musíte opakovat pro každé jádro paketů v mobilní síti.
Upozornění
Postup obnovení způsobí výpadek služby jádra paketů a přeruší síťové připojení k uživatelským prostředím až osm hodin pro každé jádro paketů. Tento postup doporučujeme provést pouze v případě, že během selhání oblasti potřebujete spravovat nasazení Azure Private 5G Core prostřednictvím Azure.
Odpojení zařízení Azure Stack Edge od oblasti, která selhala
Zařízení Azure Stack Edge aktuálně spouští základní software paketů a řídí se z oblasti, která selhala. Pokud chcete odpojit zařízení Azure Stack Edge od neúspěšné oblasti a odebrat spuštěné jádro paketů, musíte postupovat podle pokynů pro resetování a opětovnou aktivaci zařízení Azure Stack Edge. Všimněte si, že tím se odebere veškerý software, který je aktuálně spuštěný na vašem zařízení Azure Stack Edge, nejen v základním softwaru paketů, takže se ujistěte, že máte možnost přeinstalovat jakýkoli jiný software na zařízení. Tím se spustí výpadek sítě pro všechna zařízení připojená k jádru paketů na tomto zařízení Azure Stack Edge.
Připojení zařízení Azure Stack Edge k nové oblasti
Postupujte podle pokynů v Komisi, aby cluster AKS znovu nasadil cluster Azure Kubernetes Service na zařízení Azure Stack Edge. Ujistěte se, že pro tuto novou instalaci použijete jiný název, abyste se vyhnuli konfliktům při obnovení neúspěšné oblasti. V rámci tohoto procesu získáte nové ID vlastního umístění clusteru, které byste si měli poznamenat.
Přeinstalace a ověření
Zkopírujte hodnoty packetCoreControlPlanes.platform, které jste uložili v části Příprava, a aktualizujte pole packetCoreControlPlane.platform.customLocation s ID vlastního umístění, které jste si poznamenali výše. Ujistěte se, že packetCoreControlPlane.platform.azureStackEdgeDevice odpovídá ID zařízení Azure Stack Edge, na které chcete nainstalovat jádro paketů. Teď postupujte podle pokynů k úpravě jádra paketů a aktualizujte jádro záložních paketů hodnotami platformy. Tím se aktivuje nasazení jádra paketů na zařízení Azure Stack Edge.
Pokud chcete ověřit novou instalaci lokality, měli byste postupovat podle normálního postupu, abyste potvrdili, že se obnovilo připojení UE a že všechny síťové funkce jsou funkční. Konkrétně byste měli potvrdit, že řídicí panely webu na webu Azure Portal zobrazují registrace uživatelského prostředí a že data procházejí rovinou dat.
Obnovená oblast se nezdařila.
Když se neúspěšná oblast obnoví, měli byste zajistit synchronizaci konfigurace ve dvou oblastech provedením zálohy z aktivní oblasti zálohování do obnovené primární oblasti podle kroků v části Příprava.
Musíte také zkontrolovat a odebrat všechny prostředky v obnovené oblasti, které nebyly zničeny předchozími kroky:
- Pro každé zařízení Azure Stack Edge, které jste přesunuli do oblasti zálohování (podle kroků v části Obnovení), musíte najít a odstranit starý prostředek clusteru ARC. ID tohoto prostředku je v poli packetCoreControlPlane.platform.customLocation z hodnot, které jste zálohovali v části Příprava. Stav tohoto prostředku se odpojí , protože odpovídající cluster Kubernetes byl odstraněn jako součást procesu obnovení.
- Pro každé jádro paketů, které jste přesunuli do oblasti zálohování (podle kroků v části Obnovení), musíte najít a odstranit všechny objekty NFM v obnovené oblasti. Budou uvedené ve stejné skupině prostředků jako prostředky řídicí roviny jádra paketů a hodnota Oblast bude odpovídat obnovené oblasti.
Pak máte dvě možnosti pro průběžnou správu:
- Jako novou primární oblast použijte oblast provozního zálohování a jako zálohu použijte obnovenou oblast. Nevyžaduje se žádná další akce.
- Změňte obnovenou oblast na novou aktivní primární oblast podle pokynů v části Přesun prostředků do jiné oblasti a přepněte zpět do obnovené oblasti.
Testování
Pokud chcete otestovat plány zotavení po havárii, můžete postupovat podle postupu obnovení pro jedno jádro paketů kdykoli. Mějte na paměti, že to způsobí výpadek služby jádra paketů a přeruší síťové připojení k vašim uživatelským prostředím až čtyři hodiny, takže doporučujeme to provést pouze s neprodukčními nasazeními jader paketů nebo v době, kdy výpadek nebude mít nepříznivý vliv na vaši firmu.