Sdílet prostřednictvím


Připravenost na incidenty Microsoft Azure

Když je deklarován incident Azure, oznamujeme aktualizace ovlivněným předplatným nebo tenantům prostřednictvím okna Problémy se službami ve službě Azure Service Health (na webu Azure Portal).

Před incidentem

Doporučujeme, abyste připravili následující kroky a pomohli chránit vaši organizaci:

Upozorňování a aktualizace incidentů ovlivňujících vaše služby Azure

  1. Seznamte se se službou Azure Service Health na webu Azure Portal – v případě problémů přejděte na místo.

  2. Nakonfigurujte upozornění služby Service Health, která vás upozorní na případné problémy – e-mailem, SMS, webhookem atd. na úrovni předplatného, podle služeb a/ nebo podle oblastí.

    • Typ oznámení o problémech se službami upozorní vaši organizaci , že na vaše služby mají vliv incidenty služeb.

    • Typ oznámení poradce pro zabezpečení upozorní vaši organizaci , že vaše služby jsou ovlivněny incidentem zabezpečení nebo incidentem ochrany osobních údajů.

    Tady jsou základní doporučení pro konfiguraci upozornění:

    • V případě problémů se službami, typy poradce pro plánovanou údržbu a stav:

      • Vaše kritické úlohy – nastavte upozornění pro vaše předplatná a služby, které skýtá vaše kritické úlohy.
      • Nastavení upozornění pro základní služby ve službě Azure Stack:
        • Služba Síťová infrastruktura – základní vrstva ve službě Azure Stack, na které se spoléhají všechny typy úloh a aplikací z IaaS na SaaS.
        • Služba Microsoft Azure Portal – základní služba používaná ke správě prostředků Azure. Její všestrannost ho umístí jako službu "catch-all", která pokrývá celou řadu scénářů, ovlivňuje souhrnné zkušenosti, které se budou předávat v rámci této služby.
    • Typ informačních zpravodajů zabezpečení:

      • Všechna předplatná a služby Azure – obvykle chybné objekty actor cílí na méně používané prostředky, takže je důležité, aby tento typ upozornění zahrnoval všechny prostředky Azure.

    Kromě toho řešení standardních upozornění služby Azure Monitor poskytuje komplexní pokyny a kód pro implementaci standardních hodnot upozornění platformy a výstrah stavu služeb prostřednictvím zásad a iniciativ v prostředích Azure s možnostmi automatizovaného nebo ručního nasazení.

  3. Ujistěte se, že následující role mají správné kontaktní informace a pravidelně se kontrolují, aby zůstaly aktuální. Další informace najdete v tématu O problémech se zabezpečením Azure – Azure Service Health | Microsoft Learn)

    • Správce předplatného a vlastník předplatného – kontakty, které se použijí k přijímání oznámení (prostřednictvím webu Azure Portal nebo e-mailu v závislosti na požadavcích na komunikaci) pro problémy se zabezpečením, které mají vliv na úrovni předplatného.

    • Globální správce tenanta a technický kontakt – kontakty, které se použijí k přijímání oznámení (prostřednictvím webu Azure Portal nebo e-mailu v závislosti na požadavcích na komunikaci) kvůli problémům se zabezpečením, které mají vliv na úrovni tenanta.

    • Správce zabezpečení – může kontrolovat a provádět změny zásad zabezpečení, používat doporučení a zobrazovat a zamítnout výstrahy.

  4. Zvažte použití výstrah stavu nebo plánovaných událostí , abyste měli přehled o konkrétních problémech, aby vaši lidé a systémy mohli být informováni o konkrétních problémech a nadcházejících událostech údržby.

Pokud chcete porozumět principům komunikace Azure, projděte si prostředí pro zvýšení výpadku – automatizaci, komunikaci a transparentnost | Blog a aktualizace Azure | Microsoft Azure.

Zvýšení stavu zabezpečení a odolnosti, abyste se potenciálně vyhnuli nebo minimalizovali dopad incidentů

  1. Projděte si a implementujte osvědčené postupy provozního zabezpečení pro ochranu dat, aplikací a dalších prostředků, zejména tyto:

    • Vynucujte vícefaktorové ověřování , aby se zmírňovaly obavy z ohrožení.

    • Implementujte výstrahy pro uživatele s vysokým rizikem. Nakonfigurujte podmíněný přístup, abyste měli jistotu, že se ve vašem prostředí zobrazí oznámení o rizikovém uživateli.

    • Řídí přesun předplatných z adresářů a do adresářů. Pro účely zásad správného řízení můžou globální správci povolit nebo zakázat uživatelům adresáře měnit adresáře, které jsou v rámci organizace neznámé. Tím zajistíte, že vaše organizace bude mít úplný přehled o předplatných používaných v adresářích vaší organizace a zabrání přesunu předplatných, která by mohla přejít do neznámého adresáře.

  2. Optimalizujte spolehlivost a zabezpečení kritických úloh pomocí architektury Azure Well-Architected Framework (WAF) a kontroly. Zvažte také tyto akce k doplnění práce ve WAF.

    • Využijte sešit se spolehlivostí, který je integrovaný do webu Azure Portal v okně Azure Advisoru, a zkontrolujte stav spolehlivosti vašich aplikací, vyhodnoťte rizika a vylepšení plánu.

    • Rozšíření úloh a nasazení napříč oblastmi pro zajištění provozní kontinuity a zotavení po havárii (BCDR). Použijte publikovaný úplný seznam párů oblastí Azure.

    • Rozšíření úloh nebo nasazení v rámci oblasti napříč Zóny dostupnosti

    • Zvažte izolaci virtuálních počítačů v Azure – Azure Virtual Machines | Microsoft Learn pro důležité obchodní úlohy

    • Zvažte konfiguraci údržby , abyste mohli řídit a spravovat aktualizace pro mnoho virtuálních počítačů Azure.

    • K vyhodnocení odolnosti aplikací Azure použijte Azure Chaos Studio . Na základě kontrolovaných chyb, skutečných nebo simulovaných aplikací můžete sledovat odolnost aplikací a reagovat na přerušení, jako je latence sítě, výpadek úložiště, vypršení platnosti tajných kódů a výpadek datacentra.

    • Využijte sešit vyřazení služby, který je integrovaný do webu Azure Portal v okně Azure Advisoru, protože zobrazení na úrovni jednoho centralizovaného prostředku při vyřazení služeb z provozu. Pomáhá vyhodnotit dopad, vyhodnotit možnosti a naplánovat migraci z vyřazení služeb a funkcí z provozu.

Sledujte prosím blog o podpoře spolehlivosti Azure, abyste zůstali v aktualizovaném stavu s úsilím Azure o trvalé odolnosti.

Během incidentu

Když incident ovlivní vaše předplatná klíčů, je důležité, abyste věděli, kde a jak najít relevantní komunikaci kolem tohoto incidentu:

  1. Projděte si upozornění služby Azure Service Health na webu Azure Portal, kde najdete nejnovější aktualizace od našich inženýrů.

    • Je důležité si uvědomit, že konkrétní kontakty rolí uvedené v části "před incidentem" (tj. správce předplatného / vlastník, technický kontakt / kontakt na ochranu osobních údajů, správce tenanta) můžou také dostávat e-mailová oznámení o incidentech zabezpečení nebo ochrany osobních údajů.
  2. Pokud při přístupu k portálu dojde k problémům, zkontrolujte jako zálohu veřejnou stránku stavu Azure azure.status.microsoft .

  3. Pokud dojde k problémům se stránkou Stav, zkontrolujte případné aktualizace prostřednictvím @AzureSupport na X (dříve Twitter).

Proč místo veřejné stránky stavu používat Service Health?

Mnoho zákazníků kontroluje naše veřejně přístupné stavové stránky (například azure.status.microsoft) na prvních známkách potenciálních problémů, abyste zjistili, jestli u našich cloudových služeb nedochází k známým problémům. Tyto stránky zobrazují jen rozsáhlé problémy, které splňují určitá kritéria, ne menší incidenty, které mají vliv na méně zákazníků.

Azure Service Health (na webu Azure Portal) ví, která předplatná a tenanty spravujete, takže zobrazuje mnohem přesnější přehled o všech známých problémech, které mají vliv na váš výpadek. Umožňuje také nakonfigurovat výstrahy, abyste mohli být upozorněni automaticky.

Kdy je vhodné otevřít případ podpory?

Pokud už je servisní incident komunikován prostřednictvím Stav služby, najdete tady všechny nejnovější informace a není potřeba otevřít žádost o podporu. Pokud se domníváte, že jste ovlivněni servisním incidentem, ale na stránce Stav služby nevidíte problém, otevřete žádost o podporu.

Pokud se na přijaté materiály týkající se problémů se zabezpečením nevztahují otázky, otevřete žádost o podporu s odkazem na ID sledování.

Po incidentu

  1. Přečtěte si z podokna Historie stavu služby Azure Service Health (nebo prostřednictvím upozornění služby Service Health nakonfigurovaných zákazníkem) a seznamte se s tím, co jsme se naučili.

  2. U hlavních incidentů, které splňují kritéria naší veřejné stránky stavu, se připojte k retrospektivnímu živému streamu incidentu Azure, abyste získali odpovědi na jakékoli otázky nebo se na nahrávku dívali.

  3. Pokud si myslíte, že máte nárok na kredit SLA,vytvořte novou žádost o podporu s typem žádosti o refundaci a uveďte ID sledování incidentu.