Kontrolní seznam pro vysokou dostupnost a zotavení po havárii – Azure SQL Database
Platí pro: Azure SQL Database
Služba Azure SQL Database automaticky zajišťuje, aby všechny databáze byly online, v pořádku a neustále se snaží dosáhnout publikované smlouvy SLA.
Tato příručka obsahuje podrobný přehled proaktivních kroků, které můžete provést k maximalizaci dostupnosti, zajištění obnovení a přípravě na výpadky Azure. Tyto pokyny platí pro všechny nákupní modely a úrovně služeb azure SQL Database.
Kontrolní seznam k dostupnosti
Pro maximalizaci dostupnosti se doporučuje následující konfigurace:
- Začleňte do aplikace logiku opakování pro zpracování přechodných chyb.
- Časové intervaly údržby umožňují předvídatelné a méně rušivé události údržby.
- Otestujte odolnost aplikace proti chybám tím, že ručně aktivujete převzetí služeb při selhání, abyste viděli odolnost v akci.
Kontrolní seznam k vysoké dostupnosti
Pro dosažení vysoké dostupnosti se doporučuje následující konfigurace:
- Povolte zónovou redundanci, pokud je pro databázi nebo elastický fond k dispozici, abyste zajistili odolnost proti chybám zón.
Kontrolní seznam pro zotavení po havárii
I když Azure SQL Database automaticky udržuje dostupnost, existují instance, kdy i vysoká dostupnost (redundance zón) nemusí zaručit odolnost, protože dopad výpadků zahrnuje celou oblast. Výpadek regionální služby Azure SQL Database může vyžadovat zahájení zotavení po havárii.
Pokud chcete co nejlépe připravit na zotavení po havárii, postupujte podle těchto doporučení:
- Povolte skupiny převzetí služeb při selhání pro skupinu databází.
- Alternativně ke skupinám převzetí služeb při selhání můžete povolit aktivní geografickou replikaci , aby měla sekundární databázi čitelnou v jiné oblasti Azure.
- Ujistěte se, že je vytvořená geograficky sekundární databáze se stejnou úrovní služby, výpočetní úrovní (zřízenou nebo bezserverovou) a velikostí výpočetních prostředků (DTU nebo virtuálními jádry) jako primární databáze.
- Při vertikálním navýšení kapacity vertikálně navyšte kapacitu sekundární geografické oblasti a pak vertikálně navyšte kapacitu primární lokality.
- V případě vertikálního snižování kapacity postupujte v opačném pořadí: nejprve vertikálně snižte kapacitu primární databáze, a teprve pak vertikálně snižte kapacitu sekundární databáze.
- Zotavení po havárii je ze své podstaty navržené tak, aby využívalo asynchronní replikaci dat mezi primární a sekundární oblastí. Pokud chcete určit prioritu dostupnosti dat před vyšší latencí potvrzení, zvažte volání sp_wait_for_database_copy_sync uložené procedury ihned po potvrzení transakce. Volání
sp_wait_for_database_copy_sync
blokuje volající vlákno do poslední potvrzené transakce byla přenášena a posílena v transakčním protokolu sekundární databáze. - Monitorujte prodlevu s ohledem na cíl bodu obnovení (RPO) pomocí
replication_lag_sec
sloupce zobrazení dynamické správy sys.dm_geo_replication_link_status v primární databázi. Zobrazení dynamické správy zobrazuje prodlevu v sekundách mezi transakcemi potvrzenými na primární a posílené v transakčním protokolu na sekundárním serveru. Předpokládejme například, že prodleva je v okamžiku v čase jedna sekunda, pokud je primární ovlivněn výpadkem a v tomto okamžiku se zahájí geografické převzetí služeb při selhání, transakce potvrzené v poslední sekundě budou ztraceny. - Pokud povolení skupin převzetí služeb při selhání nebo aktivní geografické replikace není možné, zvažte nastavení možnosti redundance úložiště zálohování na geograficky redundantní úložiště záloh, aby bylo možné použít funkci geografického obnovení.
- Tato možnost není dostupná v oblastech bez páru oblastí.
- Často naplánujte a proveďte postupy zotavení po havárii, abyste byli lépe připraveni v případě skutečného výpadku.
Příprava sekundární na výpadek
Pokud chcete úspěšně provést obnovení do jiné oblasti dat pomocí aktivní geografické replikace, skupin převzetí služeb při selhání nebo geografického obnovení, musíte připravit sekundární logický server Azure SQL Database v jiné oblasti. V případě potřeby se tento sekundární server může stát novým primárním serverem. Měli byste mít také zdokumentované a otestované kroky, abyste zajistili bezproblémové obnovení. Mezi tyto přípravné kroky patří:
- V případě geografického obnovení identifikujte server v jiné oblasti, aby se stal novým primárním serverem. Pokud má primární oblast spárovanou oblast, je běžné použít spárovanou oblast jako sekundární oblast. Tím obvykle snížíte latenci operací replikace a geografického obnovení.
- Určete, jak budete uživatele přesměrovat na nový primární server. Přesměrování uživatelů může být provedeno ruční změnou aplikace připojovací řetězec nebo záznamů DNS. Pokud jste nakonfigurovali skupiny převzetí služeb při selhání a používali naslouchací proces jen pro čtení a čtení v aplikacích připojovací řetězec, není potřeba žádná další akce – připojení se po převzetí služeb při selhání automaticky směrují na novou primární.
- Určete a volitelně definujte pravidla brány firewall, která uživatelé potřebují pro přístup k nové primární databázi.
- Identifikujte a volitelně vytvořte přihlášení, která musí být v
master
databázi na novém primárním serveru, a ujistěte se, že tato přihlášení mají příslušná oprávnění vmaster
databázi, pokud existuje. Další informace najdete v tématu Zabezpečení služby Azure SQL Database po zotavení po havárii. - Identifikujte pravidla upozornění, která je potřeba aktualizovat, aby se namapovála na nový primární server.
- Zdokumentujte konfiguraci auditování na aktuálním primárním serveru a na sekundárním serveru ji zdokumentujte.
Související obsah
- Projděte si pokyny k zotavení po havárii služby Azure SQL Database.
- Projděte si smlouvu SLA pro Azure SQL Database.
- Informace o automatizovaných zálohách služby Azure SQL Database najdete v tématu Automatizované zálohy služby SQL Database.
- Další informace o scénářích návrhu a obnovení provozní kontinuity najdete v tématu Scénáře kontinuity.
- Další informace o používání automatizovaných záloh pro obnovení najdete v tématu obnovení databáze ze záloh iniciovaných službou.
- Přečtěte si další informace o aktivní geografické replikaci.
- Přečtěte si další informace o skupinách převzetí služeb při selhání.
- Přečtěte si další informace o geografickém obnovení.
- Přečtěte si další informace o zónově redundantních databázích.