Sdílet prostřednictvím


Co je zotavení po havárii?

Havárie je jedna velká událost s větším a delším dopadem, než aplikace může zmírnit prostřednictvím části návrhu s vysokou dostupností. Zotavení po havárii (DR) se týká zotavení z událostí s vysokým dopadem, jako jsou přírodní katastrofy nebo neúspěšná nasazení, což vede k výpadkům a ztrátě dat. Bez ohledu na příčinu je nejlepším řešením havárie dobře definovaný a otestovaný plán zotavení po havárii a návrh aplikace, který aktivně podporuje zotavení po havárii.

Cíle obnovení

Úplný plán zotavení po havárii musí určovat následující důležité obchodní požadavky pro každý proces, který aplikace implementuje:

  • Cíl bodu obnovení (RPO) je maximální přijatelná doba trvání ztráty dat. Cíl bodu obnovení se měří v jednotkách času, nikoli v objemech, například "30 minut dat" nebo "čtyři hodiny dat". RPO se týká omezení a zotavení po ztrátě dat, nikoli krádeži dat.

  • Cíl doby obnovení (RTO) je maximální přijatelná doba trvání výpadku, kdy je "výpadek" definovaný vaší specifikací. Pokud je například přijatelná doba trvání výpadku v havárii osm hodin, je RTO osm hodin.

Snímek obrazovky s dobami trvání RTO a RPO v hodinách

Každý hlavní proces nebo úloha, které aplikace implementuje, by měly mít samostatné hodnoty RPO a RTO prozkoumáním rizik scénářů havárie a potenciálních strategií obnovení. Proces určení cíle bodu obnovení (RPO) a RTO efektivně vytváří požadavky na zotavení po havárii pro vaši aplikaci v důsledku jedinečných obchodních obav (náklady, dopad, ztráta dat atd.).

Návrh pro zotavení po havárii

Zotavení po havárii není automatická funkce, ale musí být navržena, sestavena a testována. Pokud chcete podporovat solidní strategii zotavení po havárii, musíte vytvořit aplikaci s ohledem na zotavení po havárii od základů. Azure nabízí služby, funkce a pokyny, které vám pomůžou podporovat zotavení po havárii při vytváření aplikací. Abyste pochopili, co potřebujete udělat pro podporu zotavení po havárii, musíte nejprve pochopit model sdílené odpovědnosti za odolnost. Další informace najdete v tématu Sdílená odpovědnost za odolnost.

Obnovení dat

Během havárie existují dvě hlavní metody obnovení dat: zálohy a replikace.

Zálohování obnoví data do určitého bodu v čase. Pomocí zálohování můžete poskytovat jednoduchá, zabezpečená a nákladově efektivní řešení pro zálohování a obnovení dat do cloudu Microsoft Azure. Pomocí služby Azure Backup můžete vytvářet dlouhodobé snímky dat jen pro čtení pro použití při obnovení.

Replikace dat vytváří kopie živých dat v reálném čase nebo téměř v reálném čase v několika replikách úložiště dat s minimální ztrátou dat. Cílem replikace je zajistit synchronizaci replik s minimální možnou latencí při současném zachování rychlosti odezvy aplikace. Většina plně vybavených databázových systémů a dalších produktů a služeb pro ukládání dat zahrnuje určitý druh replikace jako úzce integrovanou funkci z důvodu jeho funkčních a výkonnostních požadavků. Příkladem je geograficky redundantní úložiště (GRS).

Různé návrhy replikace umisťuje různé priority na konzistenci dat, výkon a náklady.

  • Aktivní replikace vyžaduje, aby aktualizace probíhaly na několika replikách současně, a tak zaručuje vyšší konzistenci za cenu nižší propustnosti.

  • Pasivní replikace provádí synchronizaci na pozadí a odebírá replikaci jako omezení výkonu aplikace, ale zvyšuje cíl bodu obnovení.

  • Replikace typu Aktivní-aktivní nebo multimaster umožňuje současně používat více replik, což umožňuje vyrovnávání zatížení za cenu komplikování konzistence dat.

  • Replikace aktivní-pasivní vyhrazuje repliky pro živé použití pouze při převzetí služeb při selhání.

Poznámka:

Většina plně vybavených databázových systémů a dalších produktů a služeb úložiště dat zahrnuje určitý druh replikace, jako je geograficky redundantní úložiště (GRS) kvůli jejich funkčním a výkonnostním požadavkům.

Vytváření odolných aplikací

Scénáře havárie také často vedou k výpadkům, ať už kvůli problémům s připojením k síti, výpadkům datacentra, poškozeným virtuálním počítačům nebo poškozeným nasazením softwaru. Ve většině případů obnovení aplikace zahrnuje převzetí služeb při selhání do samostatného funkčního nasazení. V důsledku toho může být nutné obnovit procesy v jiné oblasti Azure v případě rozsáhlé havárie. Mezi další aspekty patří: umístění obnovení, počet replikovaných prostředí a způsob údržby těchto prostředí.

V závislosti na návrhu aplikace můžete použít několik různých strategií a funkcí Azure, jako je Azure Site Recovery, a zlepšit tak podporu obnovení procesů po havárii vaší aplikace.

Funkce zotavení po havárii specifické pro službu

Většina služeb, které běží na platformě Azure jako služba (PaaS), jako je Aplikace Azure Service, poskytuje funkce a pokyny pro podporu zotavení po havárii. V některých scénářích můžete pomocí funkcí specifických pro služby podporovat rychlé obnovení. Například Azure SQL Server podporuje geografickou replikaci umožňující rychlé obnovení služby v jiné oblasti. Azure App Service obsahuje funkci zálohování a obnovení a v dokumentaci najdete pokyny k použití služby Azure Traffic Manager pro zajištění podpory směrování provozu do sekundární oblasti.

Další kroky