Upravit

Sdílet prostřednictvím


Zotavení po havárii pro datovou platformu Azure – architektura

Azure Synapse Analytics
Azure Machine Learning
Azure Cosmos DB
Azure Data Lake
Azure Event Hubs

Definice případu použití

Pro podporu tohoto příkladu bude fiktivní firma Contoso použita s datovou platformou Azure založenou na referenčních architekturách Microsoftu.

Datová služba – zobrazení komponent

Společnost Contoso implementovala následující základní architekturu Azure, což je podmnožina návrhu cílové zóny podniku. Diagram znázorňující ukázkovou cílovou zónu Enterprise Azure

Čísla v následujících popisech odpovídají předchozímu diagramu výše.

Základy Azure společnosti Contoso – pracovní postup

  1. Podniková registrace – hlavní nadřazená podniková registrace společnosti Contoso v Rámci Azure odrážející svou komerční smlouvu s Microsoftem, strukturu organizačních účtů a dostupná předplatná Azure. Poskytuje základ fakturace pro předplatná a způsob správy digitálních aktiv.
  2. Správa identit a přístupu – Komponenty potřebné k poskytování identit, ověřování, přístupu k prostředkům a autorizačním službám napříč aktivy Azure společnosti Contoso.
  3. Organizace skupin pro správu a předplatného – škálovatelná hierarchie skupin v souladu se základními funkcemi datové platformy, což umožňuje zprovoznění ve velkém pomocí centrálně spravovaného zabezpečení a zásad správného řízení, kde mají úlohy jasné oddělení. Skupiny pro správu poskytují obor zásad správného řízení nad předplatnými.
  4. Předplatné pro správu – vyhrazené předplatné pro různé funkce na úrovni správy vyžadované pro podporu datové platformy.
  5. Předplatné připojení – vyhrazené předplatné pro funkce připojení datové platformy, které jí umožňují identifikovat pojmenované služby, určit zabezpečené směrování a komunikaci mezi interními a externími službami.
  6. Předplatné cílové zóny – předplatná 1:N pro nativní, online aplikace Azure, interní a externí úlohy a prostředky
  7. Platforma DevOps – platforma DevOps, která podporuje celá aktiva Azure. Tato platforma obsahuje úložiště správy zdrojového kódu a kanály CI/CD, které umožňují automatizovaná nasazení infrastruktury jako kódu (IaC).

Poznámka:

Mnoho zákazníků si stále zachovává nároky na rozsáhlou infrastrukturu jako službu (IaaS). Aby bylo možné poskytovat možnosti obnovení napříč IaaS, je klíčovou komponentou, která se má přidat, Azure Site Recovery. Site Recovery orchestruje a automatizuje replikaci virtuálních počítačů Azure mezi oblastmi, místními virtuálními počítači a fyzickými servery do Azure a místními počítači do sekundárního datacentra.

V rámci této základní struktury společnost Contoso implementovala následující prvky, které podporují potřeby podnikového business intelligence, a to v souladu s pokyny v Rámci analýzy kompletní s Azure Synapse.

Diagram znázorňující architekturu moderní datové platformy využívající datové služby AzureDatová platforma společnosti Contoso

Datová platforma společnosti Contoso – pracovní postup

Pracovní postup se čte zleva doprava a sleduje tok dat:

  • Zdroje dat – zdroje nebo typy dat, ze které může datová platforma využívat.
  • Ingestace – schopnost platformy ingestovat data z různých zdrojů různé struktury a rychlosti. Tento návrh odráží architekturu Lambda.
  • Store – schopnost bezpečně ukládat data ve velkém měřítku, která se ingestovala na platformu.
  • Proces – Schopnost platformy zpracovávat data, takže je vhodná pro podřízené procesy, jako je čištění, standardizace a modelování. Předběžné zpracování dat obvykle zajišťuje, že jsou v "pozici a podmínce připravené k použití".
  • Obohacení – schopnost vylepšit data zpracovávaná na platformě prostřednictvím statistických technik, strojového učení nebo jiných technik modelování nebo předem připravených služeb Azure AI.
  • Obsluha – schopnost platformy tvarovat a prezentovat data pro příjem dat.
  • Spotřebitelé dat – jednotlivci, aplikace nebo podřízené procesy, které využívají data z různých platforem obsluhujících touchpointy.
  • Zjišťování a řízení – Možnosti platformy pro řízení dat, která obsahuje, a zajištění jejich indexování, zjistitelného/prohledávatelného, dobře popsaného, s úplným rodokmenem a je transparentní pro koncové uživatele a procesy, které využívají.
  • Platforma – základ, na kterém je platforma vytvořená, tj. základy Azure společnosti Contoso, jak je popsáno výše.

Poznámka:

Pro mnoho zákazníků bude použitá koncepční úroveň referenční architektury datové platformy zarovnaná, ale fyzická implementace se může lišit. Procesy ELT (extrakce, načítání, transformace) se můžou provádět například prostřednictvím služby Azure Data Factory a modelování dat serverem Azure SQL. Informace o řešení tohoto problému najdete v části Stavové a bezstavové komponenty uvedené níže.

Pro datovou platformu společnost Contoso vybrali nejnižší doporučené produkční úrovně služeb pro všechny komponenty a rozhodli se přijmout strategii opětovného nasazení zotavení po havárii (DR) na základě přístupu minimalizace provozních nákladů.

Následující části poskytují základní informace o procesu zotavení po havárii a využití, které jsou zákazníkům k dispozici k zajištění tohoto stavu.

Zobrazení služeb a komponent Azure

Následující tabulky představují rozpis jednotlivých služeb a součástí Azure používaných napříč platformou Contoso – Data s možnostmi zotavení po havárii.

Poznámka:

Následující části jsou uspořádané podle stavových a bezstavových služeb.

Stavové základní komponenty

  • ID Microsoft Entra včetně nároků rolí

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Premium P1
    • Možnosti zotavení po havárii: Odolnost Microsoft Entra je součástí nabídky softwaru jako služby (SaaS).
    • Poznámky
  • Azure Key Vault

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Není k dispozici
    • Možnosti zotavení po havárii: Není k dispozici, které jsou součástí služby Azure.
  • Trezor služby Recovery Services

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Výchozí (geograficky redundantní úložiště (GRS))
    • Možnosti zotavení po havárii: Povolení obnovení mezi oblastmi vytvoří obnovení dat v sekundární spárované oblasti.
    • Poznámky
      • I když je k dispozici místně redundantní úložiště (LRS) a zónově redundantní úložiště (ZRS), vyžaduje aktivity konfigurace z výchozího nastavení.
  • Azure DevOps

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: DevOps Services
    • Možnosti zotavení po havárii: Služba DevOps a odolnost dat jsou součástí nabídky SaaS.
    • Poznámky
      • DevOps Server jako místní nabídka zůstane odpovědností zákazníka za zotavení po havárii.
      • Pokud se používají například služby třetích stran (SonarCloud, Jfrog Artifactory, Jenkins build servers), zůstanou odpovědností zákazníka za zotavení po havárii.
      • Pokud se virtuální počítače IaaS používají v sadě nástrojů DevOps, zůstanou odpovědností zákazníka za zotavení po havárii.

Bezstavové základní komponenty

  • Předplatná

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Není k dispozici
    • Možnosti zotavení po havárii: Není k dispozici, které jsou součástí služby Azure.
  • Skupiny pro správu

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Není k dispozici
    • Možnosti zotavení po havárii: Není k dispozici, které jsou součástí služby Azure.
  • Azure Monitor

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Není k dispozici
    • Možnosti zotavení po havárii: Není k dispozici, které jsou součástí služby Azure.
  • Správa nákladů

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Není k dispozici
    • Možnosti zotavení po havárii: Není k dispozici, které jsou součástí služby Azure.
  • Microsoft Defender for Cloud

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Není k dispozici
    • Možnosti zotavení po havárii: Není k dispozici, které jsou součástí služby Azure.
  • Azure DNS

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Jedna zóna – veřejná
    • Možnosti zotavení po havárii: N/A, DNS je vysoce dostupný podle návrhu.
  • Network Watcher

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Není k dispozici
    • Možnosti zotavení po havárii: Není k dispozici, které jsou součástí služby Azure.
  • Virtuální sítě, včetně podsítí, trasy definované uživatelem a skupin zabezpečení sítě (NSG)

    • Odpovědnost za obnovení součástí: Contoso
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Není k dispozici
    • Možnosti zotavení po havárii: Virtuální sítě je možné replikovat do sekundární spárované oblasti.
  • Azure Firewall

    • Odpovědnost za obnovení součástí: Contoso
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Standard
    • Možnosti zotavení po havárii: Služba Azure Firewall je navržena s vysokou dostupností a je možné ji vytvořit s Zóny dostupnosti pro zajištění vyšší dostupnosti.
  • Azure DDoS

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Ochrana sítě DDoS
    • Možnosti zotavení po havárii: Není k dispozici, které jsou součástí služby Azure.
  • Okruh ExpressRoute

    • Odpovědnost za obnovení součástí: Contoso, partner připojení a Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Partner připojení a Microsoft
    • Výběr skladové položky Contoso: Standard
    • Možnosti zvedání dr:
    • Poznámky
      • ExpressRoute má předem připravenou redundanci, přičemž každý okruh se skládá ze dvou připojení ke dvěma hraničním směrovačům Microsoft Enterprise (MSEEs) v umístění ExpressRoute z hraniční sítě poskytovatele připojení nebo klienta.
      • Okruh ExpressRoute Premium umožní přístup ke všem oblastem Azure globálně.
  • VPN Gateway

    • Odpovědnost za obnovení součástí: Contoso
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Jedna zóna – VpnGw1
    • Možnosti zotavení po havárii: Bránu VPN je možné nasadit do zóny dostupnosti s skladovými položkami VpnGw#AZ za účelem zajištění zónově redundantní služby.
  • Azure Load Balancer

    • Odpovědnost za obnovení součástí: Contoso
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Standard
    • Možnosti zvedání dr:
      • Nástroj pro vyrovnávání zatížení je možné nakonfigurovat pro redundanci zón v rámci oblasti s zónami dostupnosti. Pokud ano, cesta k datům přežije tak dlouho, dokud jedna zóna v rámci oblasti zůstane v pořádku.
      • V závislosti na primární oblasti je možné nasadit nástroj pro vyrovnávání zatížení mezi oblastmi pro vysoce dostupné nasazení napříč oblastmi.
    • Poznámky
      • Azure Traffic Manager je nástroj pro vyrovnávání zatížení provozu založený na DNS. Tato služba podporuje distribuci provozu pro veřejné aplikace napříč globálními oblastmi Azure. Toto řešení zajistí ochranu před regionálním výpadkem v rámci návrhu s vysokou dostupností.

Stavové služby specifické pro datovou platformu

  • Účet úložiště: Azure Data Lake Gen2

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: LRS
    • Možnosti zotavení po havárii: Účty úložiště mají širokou škálu možností redundance dat od redundance primární oblasti až po redundanci sekundární oblasti.
    • Poznámky
      • GrS se doporučuje vylepšovat redundanci, která poskytuje kopii dat ve spárované oblasti.
  • Azure Event Hubs

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Standard
    • Možnosti upliftu zotavení po havárii: Obor názvů centra událostí lze vytvořit s povolenými zónami dostupnosti. Tuto odolnost je možné rozšířit tak, aby zahrnovala úplný výpadek oblasti s geografickým zotavením po havárii.
    • Poznámky
      • Geografická zotavení po havárii služby Event Hubs záměrně nereplikuje data, proto je potřeba vzít v úvahu několik aspektů pro převzetí služeb při selhání a náhradní řešení.
  • Azure IoT Hubs

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Standard
    • Možnosti zvedání dr:
      • Odolnost služby IoT Hub je možné vylepšovat implementací vysoké dostupnosti napříč oblastmi.
      • Microsoft poskytuje následující pokyny pro možnosti vysoké dostupnosti a zotavení po havárii.
    • Poznámky
      • IoT Hub poskytuje převzetí služeb při selhání iniciované Microsoftem a ruční převzetí služeb při selhání tím, že replikuje data do spárované oblasti pro každé centrum IoT.
      • IoT Hub poskytuje vysokou dostupnost v rámci oblasti a automaticky použije zónu dostupnosti, pokud je vytvořená v předdefinované sadě oblastí Azure.
  • Azure Stream Analytics

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Standard
    • Možnosti zotavení po havárii: Azure Stream Analytics je plně spravovaná nabídka platformy jako služby (PaaS), ale neposkytuje automatické geografické převzetí služeb při selhání. Geografickou redundanci je možné dosáhnout nasazením identických úloh Stream Analytics ve více oblastech Azure.
  • Azure Machine Learning

  • Power BI

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Power BI Pro
    • Možnosti zotavení po havárii: N/A, odolnost Power BI je součástí nabídky SaaS.
    • Poznámky
  • Azure Cosmos DB

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Zápis do jedné oblasti s pravidelným zálohováním
    • Možnosti zvedání dr:
      • Účty v jedné oblasti můžou po výpadku oblasti ztratit dostupnost. Odolnost je možné vylepšovat do jedné oblasti zápisu a alespoň do druhé oblasti (pro čtení) a povolit převzetí služeb při selhání spravované službou.
      • Doporučuje se, aby účty Služby Azure Cosmos DB používané pro produkční úlohy umožňovaly automatické převzetí služeb při selhání. V případě absence této konfigurace dojde ke ztrátě dostupnosti zápisu po celou dobu výpadku oblasti zápisu, protože ruční převzetí služeb při selhání nebude úspěšné kvůli nedostatku připojení k oblasti.
    • Poznámky
  • Azure Data Share

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Není k dispozici
    • Možnosti zotavení po zotavení po havárii: Odolnost služby Azure Data Share je možné vylepšovat nasazením vysoké dostupnosti do sekundární oblasti.
  • Microsoft Purview

Bezstavové služby specifické pro datovou platformu

  • Azure Synapse: Kanály

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Computed Optimized Gen2
    • Možnosti zotavení po havárii: N/A, Odolnost Synapse je součástí nabídky SaaS pomocí funkce automatického převzetí služeb při selhání .
    • Poznámky
      • Pokud se používají místní datové kanály, zůstanou odpovědností zákazníka za zotavení po havárii.
  • Azure Synapse: Fondy Průzkumníka dat

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Vypočítaná optimalizovaná, malá (4 jádra)
    • Možnosti zotavení po havárii: N/A, Odolnost Synapse je součástí nabídky SaaS.
    • Poznámky
      • Zóny dostupnosti jsou ve výchozím nastavení povolené pro Průzkumník dat Synapse, kde je k dispozici.
  • Azure Synapse: Fondy Sparku

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Vypočítaná optimalizovaná, malá (4 jádra)
    • Možnosti zotavení po havárii: N/A, Odolnost Synapse je součástí nabídky SaaS.
    • Poznámky
  • Azure Synapse: Bezserverové a vyhrazené fondy SQL

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Contoso
    • Výběr skladové položky Contoso: Computed Optimized Gen2
    • Možnosti zotavení po havárii: N/A, Odolnost Synapse je součástí nabídky SaaS.
    • Poznámky
      • Azure Synapse Analytics automaticky po celý den vytváří snímky , aby se vytvořily body obnovení, které jsou k dispozici po dobu sedmi dnů.
      • Azure Synapse Analytics provádí standardní geografické zálohování jednou denně do spárovaného datacentra. Cíl bodu obnovení (RPO) v případě geografického obnovení je 24 hodin.
      • Pokud se používají místní datové kanály, zůstanou jejich odpovědností zákazníci po havárii.
  • Služby Azure AI (dříve Cognitive Services)

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Průběžné platby
    • Možnosti zotavení po havárii: N/A, rozhraní API pro služby AI jsou hostována datovými centry spravovanými Microsoftem.
    • Poznámky
      • Pokud se služby AI nasadí přes kontejnery Dockeru nasazené zákazníkem, zůstává obnovení odpovědností zákazníka.
  • Azure AI Search (dříve Cognitive Search)

    • Odpovědnost za obnovení součástí: Microsoft
    • Odpovědnost za obnovení úloh/konfigurace: Microsoft
    • Výběr skladové položky Contoso: Standard S1
    • Možnosti zvedání dr:
    • Poznámky
      • V oblasti provozní kontinuity AI Search (a zotavení po havárii) se dosahuje prostřednictvím několika Search AI.
      • neexistuje žádný integrovaný mechanismus pro zotavení po havárii. Pokud je během závažného selhání vyžadována nepřetržitá služba, doporučujeme mít druhou službu v jiné oblasti a implementovat strategii geografické replikace, která zajistí, aby indexy byly plně redundantní napříč všemi službami.

Stavové a bezstavové komponenty

Rychlost inovací v rámci produktové sady Microsoftu a Azure zejména znamená, že sada komponent, kterou jsme pro tento příklad použili, se rychle vyvíjí. Pro budoucí testování proti poskytnutí zastaralých pokynů a rozšíření těchto pokynů na komponenty, které nejsou explicitně popsány v tomto dokumentu, najdete níže uvedené pokyny na základě přibližné klasifikace stavu.

Komponentu nebo službu lze popsat jako stavovou, pokud je navržená tak, aby si zapamatovala předchozí události nebo interakce uživatelů. Bezstavový znamená, že neexistují žádné záznamy o předchozích interakcích a každý požadavek na interakci musí být zpracován zcela na základě informací, které jsou s nimi součástí.

Scénář zotavení po havárii, který volá opětovné nasazení:

  • Komponenty a služby, které jsou "bezstavové", jako jsou služby Azure Functions a kanály Azure Data Factory, je možné znovu nasadit ze správy zdrojového kódu s alespoň orientačním testem, který ověří dostupnost předtím, než se do širšího systému zavede.
  • Komponenty a služby, které jsou "stavové", jako jsou účty Azure SQL Database a úložiště, vyžadují větší pozornost.
    • Při pořízení komponenty bude klíčovým rozhodnutím vybrat funkci redundance dat. Toto rozhodnutí se obvykle zaměřuje na kompromis mezi dostupností a stálostí s provozními náklady.
  • Úložiště dat budou také potřebovat strategii zálohování dat. Funkce redundance dat základního úložiště snižuje toto riziko u některých návrhů, zatímco jiné, jako jsou databáze SQL, budou potřebovat samostatný proces zálohování.
    • V případě potřeby lze komponentu znovu nasadit ze správy zdrojového kódu s ověřenou konfigurací prostřednictvím orientačního testu.
    • Znovu nasazené úložiště dat musí mít rehydrovanou datovou sadu. Dosazování je možné provést prostřednictvím redundance dat (pokud je k dispozici) nebo zálohované datové sady. Po dokončení dosazování je nutné ověřit přesnost a úplnost.
      • V závislosti na povaze procesu zálohování můžou zálohované datové sady před uplatněním vyžadovat ověření. Poškození nebo chyby procesu zálohování můžou vést k dřívějšímu použití zálohy místo nejnovější dostupné verze.
    • Jakýkoli rozdíl mezi datem a časovým razítkem komponenty a aktuálním datem by měl být vyřešen opětovným zahájením nebo přehráním procesů příjmu dat z tohoto bodu vpřed.
    • Jakmile je datová sada komponenty aktuální, můžete ji zavést do širšího systému.

Další klíčové služby

Tato část obsahuje pokyny pro vysokou dostupnost (HA) a zotavení po havárii pro další klíčové datové komponenty a služby Azure.

Další kroky

Teď, když jste se seznámili s architekturou scénáře, se můžete seznámit s podrobnostmi o scénáři.