Sdílet prostřednictvím


Spolehlivost ve službě Virtual Machines

Tento článek obsahuje podrobné informace o regionální odolnosti virtuálních počítačů pomocí zón dostupnosti a zotavení po havárii mezi oblastmi a provozní kontinuitě.

Podpora zón dostupnosti

Zóny dostupnosti jsou fyzicky oddělené skupiny datacenter v rámci každé oblasti Azure. Když jedna zóna selže, můžou služby převzít služby při selhání jedné ze zbývajících zón.

Další informace o zónách dostupnosti v Azure najdete v tématu Co jsou zóny dostupnosti?.

Virtuální počítače podporují zóny dostupnosti se třemi zónami dostupnosti na podporovanou oblast Azure a jsou také zónově redundantní a zónově zónově redundantní. Další informace najdete v tématu Služby Azure se zónami dostupnosti. Zákazník zodpovídá za konfiguraci a migraci svých virtuálních počítačů za dostupnost.

Další informace o možnostech připravenosti zón dostupnosti najdete tady:

Požadavky

  • Skladové položky vašeho virtuálního počítače musí být dostupné napříč zónami ve vaší oblasti. Pokud chcete zkontrolovat, které oblasti podporují zóny dostupnosti, podívejte se na seznam podporovaných oblastí.

  • Skladové položky virtuálních počítačů musí být dostupné napříč zónami ve vaší oblasti. Pokud chcete zkontrolovat dostupnost skladové položky virtuálního počítače, použijte jednu z následujících metod:

Vylepšení smlouvy SLA

Vzhledem k tomu, že zóny dostupnosti jsou fyzicky oddělené a poskytují odlišný zdroj napájení, síť a chlazení, zvyšují se smlouvy SLA (smlouvy o úrovni služeb). Další informace najdete v tématu SLA pro virtuální počítače.

Vytvoření prostředku s povolenými zónami dostupnosti

Začněte vytvořením virtuálního počítače s povolenou zónou dostupnosti z následujících možností nasazení:

Podpora zónových převzetí služeb při selhání

Virtuální počítače můžete nastavit tak, aby převzaly služby při selhání do jiné zóny pomocí služby Site Recovery. Další informace najdete v tématu Site Recovery.

Odolnost proti chybám

Virtuální počítače můžou převzít služby při selhání na jiný server v clusteru s restartováním operačního systému virtuálního počítače na novém serveru. Měli byste se podívat na proces převzetí služeb při selhání pro zotavení po havárii, shromažďování virtuálních počítačů při plánování obnovení a spouštění postupů zotavení po havárii, abyste zajistili, že jejich řešení odolnosti proti chybám bude úspěšné.

Další informace najdete v procesech obnovení lokality.

Prostředí pro zónu dolů

Během výpadku v celé zóně byste měli očekávat krátké snížení výkonu, dokud služba virtuálního počítače nevyrovná základní kapacitu tak, aby se přizpůsobila zónám, které jsou v pořádku. Samoopravení není závislé na obnovení zóny; Očekává se, že stav samoobslužného opravy služby spravované Microsoftem kompenzuje ztrátu zóny pomocí kapacity z jiných zón.

Měli byste se také připravit na možnost výpadku celé oblasti. Pokud dojde k přerušení služby pro celou oblast, budou místně redundantní kopie vašich dat dočasně nedostupné. Pokud je povolená geografická replikace, ukládají se tři další kopie objektů blob a tabulek Azure Storage v jiné oblasti. Pokud dojde k úplnému výpadku oblasti nebo havárii, ve které primární oblast není možné obnovit, Azure přemapuje všechny položky DNS na geograficky replikovanou oblast.

Příprava a obnovení výpadku zóny

Následující doprovodné materiály jsou k dispozici pro virtuální počítače Azure během přerušení služby v celé oblasti, ve které je nasazená vaše aplikace virtuálního počítače Azure:

  • Konfigurace Azure Site Recovery pro virtuální počítače
  • Zkontrolujte stav řídicího panelu služby Azure Service Health, pokud není nakonfigurovaná služba Azure Site Recovery.
  • Kontrola fungování služby Azure Backup pro virtuální počítače
    • Viz matice podpory pro zálohování virtuálních počítačů Azure.
  • Určení nejvhodnější možnosti a scénáře obnovení virtuálního počítače pro vaše prostředí

Návrh s nízkou latencí

Při návrhu řešení virtuálního počítače s nízkou latencí je k dispozici možnost křížové oblasti (sekundární oblast), křížového předplatného (Preview) a více zón (Preview). Další informace o těchto možnostech najdete v podporovaných metodách obnovení.

Důležité

Tím, že se odhlásíte z nasazení pracujícího se zónou, předezníte ochranu před izolací základních chyb. Použití skladových položek, které nepodporují zóny dostupnosti nebo odhlasují od konfigurace zóny dostupnosti, se spoléhá na prostředky, které neuslyšují umístění a oddělení zón (včetně základních závislostí těchto prostředků). U těchto prostředků by se nemělo očekávat, že přežije scénáře výpadku zóny. Řešení, která využívají takové prostředky, by měla definovat strategii zotavení po havárii a nakonfigurovat obnovení řešení v jiné oblasti.

Techniky bezpečného nasazení

Pokud se rozhodnete pro izolaci zón dostupnosti, měli byste využít techniky bezpečného nasazení pro kód aplikace a upgrady aplikací. Kromě konfigurace Azure Site Recovery a implementace některé z následujících technik bezpečného nasazení pro virtuální počítače:

Vzhledem k tomu, že Společnost Microsoft pravidelně provádí aktualizace plánované údržby, mohou existovat vzácné případy, kdy tyto aktualizace vyžadují restartování virtuálního počítače, aby se požadované aktualizace použily na podkladovou infrastrukturu. Další informace najdete v aspektech dostupnosti během plánované údržby .

Před upgradem další sady uzlů v jiné zóně byste měli provést následující úlohy:

Migrace na podporu zóny dostupnosti

Informace o migraci virtuálního počítače do podpory zón dostupnosti najdete v tématu Migrace virtuálních počítačů a škálovacích sad virtuálních počítačů do podpory zóny dostupnosti.

Zotavení po havárii napříč oblastmi a provozní kontinuita

Zotavení po havárii (DR) se týká zotavení z událostí s vysokým dopadem, jako jsou přírodní katastrofy nebo neúspěšná nasazení, která vedou k výpadkům a ztrátě dat. Bez ohledu na příčinu je nejlepším řešením havárie dobře definovaný a otestovaný plán zotavení po havárii a návrh aplikace, který aktivně podporuje zotavení po havárii. Než začnete přemýšlet o vytvoření plánu zotavení po havárii, přečtěte si doporučení pro návrh strategie zotavení po havárii.

Pokud jde o zotavení po havárii, Microsoft používá model sdílené odpovědnosti. V modelu sdílené odpovědnosti Microsoft zajišťuje, aby byly dostupné základní služby infrastruktury a platformy. Současně mnoho služeb Azure automaticky nereplikuje data nebo se vrátí z oblasti, která selhala, aby se křížově replikovala do jiné povolené oblasti. Za tyto služby zodpovídáte za nastavení plánu zotavení po havárii, který funguje pro vaši úlohu. Většina služeb, které běží na nabídkách PaaS (Platforma jako služba) Azure, poskytuje funkce a pokyny pro podporu zotavení po havárii a pomocí funkcí specifických pro služby můžete podporovat rychlé obnovení , které vám pomůže s vývojem plánu zotavení po havárii.

Obnovení mezi oblastmi můžete použít k obnovení virtuálních počítačů Azure prostřednictvím spárovaných oblastí. Obnovením mezi oblastmi můžete obnovit všechny virtuální počítače Azure pro vybraný bod obnovení, pokud se záloha provádí v sekundární oblasti. Další informace o obnovení mezi oblastmi najdete v položce řádku mezi oblastmi v našich možnostech obnovení.

Zotavení po havárii v geografické oblasti s více oblastmi

V případě přerušení služeb v celé oblasti pracuje Microsoft pečlivě na obnovení služby virtuálního počítače. Stále ale musíte spoléhat na další strategie zálohování specifické pro aplikaci, abyste dosáhli nejvyšší úrovně dostupnosti. Další informace najdete v části Strategie dat pro zotavení po havárii.

Detekce výpadků, oznámení a správa

Neočekávaně může dojít k selhání hardwaru nebo fyzické infrastruktury virtuálního počítače. Mezi neočekávané chyby můžou patřit selhání místní sítě, selhání místního disku nebo jiná selhání na úrovni racku. Po zjištění platforma Azure automaticky migruje (vyřeší) váš virtuální počítač do fyzického počítače, který je v pořádku, ve stejném datovém centru. Během opravné procedury jsou virtuální počítače odstavené (restartují se) a v některých případech dojde ke ztrátě dočasné jednotky. Připojené disky s operačním systémem a datové disky se vždy zachovají.

Podrobnější informace o přerušení služeb virtuálních počítačů najdete v doprovodných materiálech k zotavení po havárii.

Nastavení detekce zotavení po havárii a výpadku

Při nastavování zotavení po havárii pro virtuální počítače zjistěte, co Azure Site Recovery poskytuje. Povolte zotavení po havárii pro virtuální počítače pomocí následujících metod:

Zotavení po havárii v geografické oblasti s jednou oblastí

S nastavením zotavení po havárii se virtuální počítače Azure průběžně replikují do jiné cílové oblasti. Pokud dojde k výpadku, můžete převzít služby při selhání virtuálních počítačů do sekundární oblasti a přistupovat k nim odtud.

Při replikaci virtuálních počítačů Azure pomocí Site Recovery se všechny disky virtuálních počítačů průběžně replikují do cílové oblasti asynchronně. Body obnovení se vytvářejí každých několik minut, což vám uděluje cíl bodu obnovení (RPO) v pořadí minut. Postupy zotavení po havárii můžete provádět tolikrát, kolikrát chcete, aniž by to mělo vliv na produkční aplikaci nebo probíhající replikaci. Další informace najdete v tématu Spuštění postupu zotavení po havárii do Azure.

Další informace najdete v tématu o komponentách architektury virtuálních počítačů Azure a párování oblastí.

Odolnost proti zotavení po havárii a proaktivní kapacita

Společnost Microsoft a její zákazníci pracují v rámci modelu sdílené odpovědnosti. Sdílená odpovědnost znamená, že pro zotavení po havárii s podporou zákazníka (služby zodpovědné za zákazníky) musíte řešit zotavení po havárii pro všechny služby, které nasazují a řídí. Aby bylo zajištěno, že obnovení je proaktivní, měli byste vždy předem nasadit sekundární soubory, protože v době dopadu na uživatele, kteří nepřidělili předem přidělenou kapacitu, není zaručená žádná záruka.

Pro nasazení virtuálních počítačů můžete použít flexibilní režim orchestrace ve škálovacích sadách virtuálních počítačů. Všechny velikosti virtuálních počítačů je možné použít s flexibilním režimem orchestrace. Flexibilní režim orchestrace také nabízí záruky vysoké dostupnosti (až 1 000 virtuálních počítačů) rozložením virtuálních počítačů mezi domény selhání v rámci oblasti nebo v rámci zóny dostupnosti.

Další kroky