Metodologie úspěšnosti implementace Synapse: Provádění kontroly provozní připravenosti

Článek
10/18/2023

Poznámka:

Tento článek je součástí úspěchu implementace Azure Synapse podle řady článků. Přehled série najdete v tématu Úspěšné implementace Azure Synapse podle návrhu.

Jakmile sestavíte řešení Azure Synapse Analytics a je připravené k nasazení, je důležité zajistit provozní připravenost tohoto řešení. Provedení kontroly provozní připravenosti vyhodnocuje připravenost řešení na zajištění optimálních služeb uživatelům. Organizace, které investují čas a prostředky do posouzení provozní připravenosti před spuštěním, mají mnohem vyšší míru úspěchu. Je také důležité pravidelně provádět kontrolu provozní připravenosti po nasazení ( možná ročně), aby se zajistilo, že nedošlo k žádnému posunu od provozních očekávání.

Zpracování a zaměření oblastí

Mezi oblasti procesu a zaměření patří provozní cíle služeb, připravenost řešení, zabezpečení, monitorování, vysoká dostupnost a zotavení po havárii (DR).

Provozní cíle služby

Zdokumentujte očekávání služeb z pohledu zákazníka a získejte nákup od firmy na základě těchto očekávání služeb. Proveďte všechny nezbytné úpravy, které splňují obchodní cíle a cíle služby.

Smlouva o úrovni služeb (SLA) každé služby Azure se liší v závislosti na této službě. Například Microsoft zaručuje konkrétní měsíční procento doby provozu. Další informace najdete ve sla pro Azure Synapse Analytics. Zajistěte, aby tyto smlouvy SLA odpovídaly vašim obchodním smlouvám SLA a zdokumentovaly případné mezery. Je také důležité definovat všechny smlouvy o úrovni provozu (OLA) mezi různými týmy a zajistit, aby byly v souladu se smlouvami SLA.

Připravenost řešení

Připravenost řešení je důležité zkontrolovat pomocí následujících bodů.

Popište celou architekturu řešení, která označuje důležité funkce různých komponent a jejich vzájemné interakce.
Zdokumentujte aspekty škálovatelnosti vašeho řešení. Uveďte konkrétní podrobnosti o úsilí souvisejícím se škálováním a dopadem na firmu. Zvažte, jestli může reagovat na náhlé nárůsty aktivity uživatelů. Mějte na paměti, že Azure Synapse poskytuje funkce pro škálování s minimálními výpadky.
Zdokumentujte všechny jednotlivé body selhání ve vašem řešení a zjistěte, jak tyto chyby obnovit. Zahrňte dopad těchto selhání na závislé služby, aby se minimalizoval dopad.
Zdokumentujte všechny závislé služby na řešení a jejich dopad.

Zabezpečení

Zabezpečení dat a ochrana osobních údajů jsou negotovatelné. Azure Synapse implementuje vícevrstvý architekturu zabezpečení pro komplexní ochranu vašich dat. Pomocí následujících bodů zkontrolujte připravenost zabezpečení.

Ověřování: Ujistěte se, že se používá ověřování Microsoft Entra, kdykoli je to možné. Pokud se používá ověřování Entra jiné společnosti než Microsoft, ujistěte se, že jsou zavedené mechanismy silného hesla a že se hesla pravidelně obměňují. Další informace najdete v tématu Pokyny k heslu. Zajistěte, aby monitorování bylo zavedeno, aby bylo zjištěno podezřelé akce související s ověřováním uživatelů. Zvažte použití služby Azure Identity Protection k automatizaci detekce a nápravy rizik založených na identitách.
Řízení přístupu: Ujistěte se, že jsou správné řízení přístupu splněné podle principu nejnižších oprávnění. Pomocí funkcí zabezpečení dostupných se službami Azure můžete posílit zabezpečení vašeho řešení. Azure Synapse například poskytuje podrobné funkce zabezpečení, včetně zabezpečení na úrovni řádků (RLS), zabezpečení na úrovni sloupců a dynamického maskování dat. Další informace najdete v dokumentu White Paper o zabezpečení služby Azure Synapse Analytics: Řízení přístupu.
Ochrana před hrozbami: Zajistěte, aby byly zavedeny správné mechanismy detekce hrozeb, které brání hrozbám, detekují je a reagují na ně. Azure Synapse poskytuje auditování SQL, detekci hrozeb SQL a posouzení ohrožení zabezpečení pro auditování, ochranu a monitorování databází. Další informace najdete v dokumentu White Paper o zabezpečení služby Azure Synapse Analytics: Detekce hrozeb.

Další informace najdete v dokumentu white paper o zabezpečení služby Azure Synapse Analytics.

Sledování

Nastavte a zdokumentujte očekávání pro monitorování připravenosti vaší firmy. Tato očekávání by měla popisovat:

Jak monitorovat celé uživatelské prostředí a jestli zahrnuje monitorování prostředí s jedním uživatelem.
Konkrétní metriky jednotlivých služeb, které se mají monitorovat.
Jak a kdo má upozorňovat na špatné uživatelské prostředí
Podrobnosti o proaktivních kontrolách stavu
Všechny mechanismy, které automatizují akce v reakci na incidenty, například automatické vyvolání lístků.

Zvažte použití služby Azure Monitor ke shromažďování, analýze a zpracování telemetrických dat z azure a místních prostředí. Azure Monitor pomáhá maximalizovat výkon a dostupnost vašich aplikací proaktivně identifikací problémů za několik sekund.

Uveďte všechny důležité metriky, které chcete monitorovat pro každou službu ve vašem řešení, spolu s jejich přijatelnými prahovými hodnotami. Můžete například zobrazit metriky pro monitorování vyhrazeného fondu SQL.

Zvažte použití služby Azure Service Health k upozornění na incidenty služeb Azure a plánovanou údržbu. Tímto způsobem můžete podniknout kroky pro zmírnění výpadků. Můžete nastavit přizpůsobitelná cloudová upozornění a pomocí přizpůsobeného řídicího panelu analyzovat problémy se stavem, monitorovat dopad na cloudové prostředky, získat pokyny a podporu a sdílet podrobnosti a aktualizace.

Nakonec se ujistěte, že jsou nastavená správná oznámení, aby oznamovali příslušné osoby, když dojde k incidentům. Incidenty můžou být proaktivní, například když určitá metrika překročí prahovou hodnotu nebo reaktivní, například selhání komponenty nebo služby. Další informace najdete v tématu Přehled výstrah v Microsoft Azure.

Vysoká dostupnost

Definujte a dokumentujte cíl doby obnovení (RTO) a cíl bodu obnovení (RPO) pro vaše řešení. RTO je, jak brzy bude služba k dispozici uživatelům, a cíl bodu obnovení je, kolik ztráty dat dojde v případě převzetí služeb při selhání.

Každá ze služeb Azure publikuje sadu pokynů a metrik pro očekávanou vysokou dostupnost služby. Zajistěte, aby tyto metriky vysoké dostupnosti odpovídaly vašim obchodním očekáváním. Pokud se neshodují, může být přizpůsobení nezbytné pro splnění požadavků na vysokou dostupnost. Vyhrazený fond SQL Azure Synapse například podporuje 8hodinový cíl bodu obnovení s automatickými body obnovení. Pokud tento cíl bodu obnovení nestačí, můžete nastavit uživatelem definované body obnovení s odpovídající frekvencí, aby vyhovovaly vašim potřebám cíle bodu obnovení. Další informace najdete v tématu Zálohování a obnovení ve vyhrazeném fondu SQL služby Azure Synapse.

Zotavení po havárii

Definujte a zdokumentujte podrobný proces pro scénáře zotavení po havárii (DR). Scénáře zotavení po havárii můžou zahrnovat proces převzetí služeb při selhání, komunikační mechanismy, proces eskalace, nastavení war room a další. Zdokumentujte také proces identifikace příčin výpadků a kroků, které je potřeba provést při zotavení z havárií.

K sestavení procesu zotavení po havárii použijte integrované mechanismy zotavení po havárii, které jsou k dispozici ve službách Azure. Azure Synapse například provádí standardní geografickou zálohu vyhrazených fondů SQL jednou denně do spárovaného datového centra. Geografickou zálohu můžete použít k zotavení po havárii v primárním umístění. Můžete také nastavit Azure Data Lake Storage (ADLS) pro kopírování dat do jiné oblasti Azure, která je vzdálená stovky kilometrů. Pokud dojde k havárii v primárním umístění, je možné zahájit převzetí služeb při selhání a transformovat sekundární umístění úložiště na primární umístění úložiště. Další informace najdete v tématu Zotavení po havárii a převzetí služeb při selhání účtu úložiště.

Další kroky

V dalším článku o úspěchu Azure Synapse v řadě návrhů se dozvíte, jak provádět monitorování řešení Azure Synapse.

Sdílet prostřednictvím