Vysvětlení postupu a očekávání během incidentu

Dokončeno

Když mluvíme o "incidentu", hovoříme konkrétně o problému na straně Microsoftu nebo Azure – problému na straně platformy, který má vliv na vaše služby. Během těchto vzácných, ale neodvratitelných problémů je naším cílem být s vámi co nejprůhlednější poskytováním pravidelných aktualizací přímo od našich inženýrů. Snažíme se informovat správné lidi prostřednictvím správných kanálů a sdílet co nejvíce podrobností.

I když obecně nesdílíme spekulaci ani vnitřní fungování kroků řešení potíží, sdílíme všechno, co víme o incidentu. V zasílání zpráv (i u podrobných zpráv) na základě velikosti zákazníka nebo segmentu, stavu partnera nebo plánu podpory nedojde ke zpoždění, aby partnerské organizace Microsoftu a dokonce i týmy účtů Microsoft byly upozorněny na stejnou dobu a se stejnými aktualizacemi jako ovlivnění zákazníci, které představují.

Během incidentu

  1. Nejnovější aktualizace od našich inženýrů najdete na webu Azure Service Health na webu Azure Portal.

    Pokud si všimnete problému a potřebujete pochopit, že se jedná o nás nebo Azure, mělo by být kontrola služby Azure Service Health na portálu prvním portem volání. I když byste si měli být vědomi tohoto místa na místě, neměli byste hledat informace reaktivně, pokud jste předem nakonfigurovali příslušná upozornění na stav služby. Během známého problému se tato upozornění služby Service Health aktivují a budou upozorněni pomocí zvoleného komunikačního kanálu.

    Poznámka:

    Připomínáme, že nastavte upozornění služby Service Health na oznámení o komunikaci portálu prostřednictvím zvoleného kanálu (e-mail, SMS, webhook).

  2. Pokud dojde k problémům s přístupem ke službě Service Health nebo samotnému portálu, podívejte se na veřejnou stránku stavu Azure.

    V nepravděpodobném případě, že se problém se službou dostane způsobem, jak na webu Azure Portal získat přístup ke službě Service Health, pak se azure.status.microsoft používá k publikování aktualizací. Tato stránka se používá pouze pro problémy, které ruší obvyklou komunikační cestu nebo pro vzácné rozšířené problémy.

    Je důležité vám připomenout, že azure.status.microsoft ve skutečnosti slouží jako záloha do služby Azure Service Health. Většina komunikace o problému se službami je poskytována jako cílová oznámení odesílaná přímo ovlivněným předplatným nebo tenantům. Tyto služby se doručují prostřednictvím služby Azure Service Health na webu Azure Portal a aktivují všechna nakonfigurovaná upozornění služby Azure Service Health. Stránka veřejného stavu (azure.status.microsoft) se používá pouze ke komunikaci o problémech se službami ve třech konkrétních scénářích:

    • Scénář 1 – Široký dopad zahrnující více oblastí, zón nebo služeb – Problém se službou má široký/významný dopad na zákazníky napříč několika službami pro celou oblast nebo více oblastí. V tomto případě vás upozorníme, protože odolnost nakonfigurovaná zákazníkem, jako je vysoká dostupnost nebo zotavení po havárii, nemusí být dostatečná, aby se zabránilo dopadu.

    • Scénář 2 – Azure Portal / Service Health nejsou přístupné – Problém se službou brání přístupu k webu Azure Portal nebo službě Azure Service Health a tím ovlivnil naši standardní komunikační cestu výpadku popsanou výše.

    • Scénář 3 – Dopad služby, ale nevím, kdo přesně je ovlivněný – Problém se službou má široký/významný dopad na zákazníky, ale zatím nemůžeme ověřit, kterých zákazníků, oblastí nebo služeb se to týká. V tomto případě nemůžeme odesílat cílené komunikace, takže poskytujeme veřejné aktualizace.

  3. Pokud na stránce Stav dochází k problémům, zkontrolujte případné aktualizace prostřednictvím @AzureSupport na X.

    V historii Azure došlo pouze k několika technickým problémům, které brání publikování aktualizací incidentů v azure.status.microsoft – za těchto výjimečných okolností zveřejníme aktualizace incidentů prostřednictvím X na adrese @AzureSupport. Bez ohledu na problém by se ale zákazníci měli nebojte obrátit na @AzureSupport případné dotazy týkající se potenciálních problémů, které vidí, nebo s dotazy ohledně podpory. Tým @AzureSupport obecně reaguje za méně než 5 minut (jsme velmi hrdí na to!), ale je důležité vědět, že během známých problémů (například pokud je výpadek uvedený ve službě Service Health), na incidentu už pracuje správní technici, takže tým může pomoct. @AzureSupport mimo přesměrování zákazníků na oficiální technické aktualizace toho, co se děje.

  4. Pokud se váš dopad nebo problémy neshodují s incidentem (nebo pokud tyto potíže po zmírnění rizika potrvají), obraťte se na podporu.

    To je nejdůležitější poznámka, kterou zákazníci při incidentu pochopili, co dělat (nebo nedělají). Jak už jsme zmínili výše, během známých problémů (například pokud dojde k výpadku ve službě Service Health), na incidentu už pracuje správný technik , takže zákazníci nemusí kontaktovat podporu aktualizací. Budou dostávat pravidelné aktualizace prostřednictvím služby Service Health (a jejich upozornění na Stav služby) a technici podpory nemají přístup k podrobnějším informacím, než jaké jsou poskytovány ovlivněným zákazníkům. Pokud si zákazníci přečetli aktualizace od technického oddělení, ale vyžadují podporu k reakci na incident (například k implementaci plánů převzetí služeb při selhání), můžou a měli by vytvořit lístek podpory.

    Podobně pokud se zdá, že příznaky, které si všimnou, se zdá, že se "zarovnají" s příznaky popsanými v aktualizacích problému (například pokud je známý problém s Redis Cache v OBLASTI USA – východ, ale dochází k problémům se službou Redis Cache v OBLASTI USA – východ 2), může to být nesouvisející a zákazníci můžou a měli by vytvořit lístek podpory. A konečně, pokud se problém se službou vyřeší nebo zmírní, ale zákazník stále dochází k problémům se svými službami, můžou jim pracovníci podpory pomoct zjistit, jestli se s jejich prostředky něco zvláštního děje, aby zákazníci mohli a měli vytvořit lístek podpory.

1.

Pokud jste ještě nenakonfigurovali příslušná upozornění na stav služby a vy si nejste jisti problémy, kde je to první místo, kde byste měli zkontrolovat, jestli se jedná o Azure, nebo ne?

2.

Ano nebo Ne: Většina komunikace o problému se službami je k dispozici na naší veřejné stránce stavu (azure.status.microsoft).

3.

Pravda nebo nepravda: Sledování @AzureSupport na X je nejlepší způsob, jak zjistit, že došlo k incidentu Azure, a abyste byli informováni.