Dowiedz się, gdzie iść i czego oczekiwać podczas zdarzenia
Kiedy mówimy o "incydencie", mówimy w szczególności o problemie po naszej stronie firmy Microsoft/Azure — problemu po stronie platformy, który ma wpływ na Twoje usługi. Podczas tych rzadkich, ale nieuniknionych problemów naszym celem jest zapewnienie możliwie jak największej przejrzystości dzięki zapewnieniu regularnych aktualizacji bezpośrednich od naszych inżynierów. Staramy się informować odpowiednich ludzi za pośrednictwem odpowiednich kanałów i jak najwięcej szczegółów.
Chociaż ogólnie nie dzielimy się spekulacjami ani wewnętrznymi krokami rozwiązywania problemów, dzielimy się wszystkim, co wiemy o zdarzeniu. Nie ma opóźnień w komunikatach — nawet w przypadku szczegółowych komunikatów — na podstawie rozmiaru klienta lub segmentu, stanu partnera lub planu pomocy technicznej — dlatego organizacje partnerskie firmy Microsoft, a nawet zespoły kont Microsoft są powiadamiane w tym samym czasie i z tymi samymi aktualizacjami co klienci, których dotyczą.
Podczas incydentu
Przejrzyj usługę Azure Service Health w witrynie Azure Portal, aby uzyskać najnowsze aktualizacje od naszych inżynierów.
Jeśli zauważysz problem i musisz zrozumieć, "czy to my, czy jest to platforma Azure", sprawdzanie usługi Azure Service Health w portalu powinno być pierwszym portem wywołania. Chociaż należy pamiętać o tym miejscu "przejdź do", nie należy szukać informacji reaktywnie, jeśli wcześniej skonfigurowano odpowiednie alerty dotyczące kondycji usługi. Podczas znanego problemu te alerty dotyczące kondycji usługi będą wyzwalane i będą powiadamiane przy użyciu wybranego kanału komunikacji.
Uwaga
Przypominamy, że skonfiguruj alert usługi Service Health, aby otrzymywać powiadomienia o komunikacji portalu za pośrednictwem wybranego kanału (wiadomość e-mail, wiadomość SMS, element webhook)
Jeśli występują problemy z dostępem do usługi Service Health lub portalu, sprawdź publiczną stronę stanu platformy Azure.
W mało prawdopodobnym przypadku, gdy problem z usługą jest w stanie uzyskać dostęp do usługi Service Health w witrynie Azure Portal, usługa azure.status.microsoft jest używana do publikowania aktualizacji. Ta strona jest używana tylko w przypadku problemów, które zakłócają zwykłą ścieżkę komunikacji lub w przypadku rzadkich powszechnych problemów.
Ważne jest, aby przypomnieć, że usługa azure.status.microsoft naprawdę służy jako kopia zapasowa usługi Azure Service Health. Większość naszej komunikacji z usługą jest dostarczana jako ukierunkowane powiadomienia wysyłane bezpośrednio do subskrypcji lub dzierżaw, których dotyczy problem. Są one dostarczane za pośrednictwem usługi Azure Service Health w witrynie Azure Portal i wyzwalają wszystkie skonfigurowane alerty usługi Azure Service Health. Strona stanu publicznego (azure.status.microsoft) służy tylko do komunikowania się z problemami z usługą w trzech konkretnych scenariuszach:
Scenariusz 1 — szeroki wpływ na wiele regionów, stref lub usług — problem z usługą ma szeroki/znaczący wpływ na klientów w wielu usługach dla całego regionu lub wielu regionów. Powiadomimy Cię w tym przypadku, ponieważ skonfigurowana przez klienta odporność, taka jak wysoka dostępność lub odzyskiwanie po awarii, może być niewystarczająca, aby uniknąć wpływu.
Scenariusz 2 — witryna Azure Portal/ usługa Service Health nie jest dostępna — problem z usługą utrudnia uzyskanie dostępu do witryny Azure Portal lub usługi Azure Service Health, co miało wpływ na naszą standardową ścieżkę komunikacji z awarią opisaną wcześniej.
Scenariusz 3 — wpływ na usługę, ale nie jest pewien, kto dokładnie jest jeszcze dotknięty — problem z usługą ma duży/znaczący wpływ na klienta, ale nie możemy jeszcze potwierdzić, których klientów, regionów lub usług dotyczy problem. W takim przypadku nie możemy wysyłać docelowej komunikacji, dlatego udostępniamy publiczne aktualizacje.
Jeśli występują problemy ze stroną Stan, sprawdź dostępność aktualizacji za pośrednictwem @AzureSupport na X.
Tylko kilka razy w historii platformy Azure wystąpiły problemy techniczne uniemożliwiające publikowanie aktualizacji zdarzeń w witrynie azure.status.microsoft — w tych nadzwyczajnych okolicznościach publikujemy aktualizacje zdarzeń za pośrednictwem platformy X pod adresem @AzureSupport. Jednak niezależnie od problemu klienci powinni swobodnie skontaktować się @AzureSupport z pytaniami dotyczącymi potencjalnych problemów, które widzą lub z pytaniami pomocy technicznej. Zespół @AzureSupport zazwyczaj reaguje w mniej niż 5 minut (jesteśmy z tego bardzo dumni!), ale ważne jest, aby wiedzieć, że podczas znanych problemów (na przykład, jeśli wystąpiła awaria wymieniona w usłudze Service Health), zdarzenie jest już opracowywane przez właściwych inżynierów, więc potencjalnie nie ma zbyt wiele, że @AzureSupport zespół będzie w stanie pomóc, poza kierowaniem klientów do oficjalnych aktualizacji inżynieryjnych tego, co się dzieje.
Jeśli wpływ/problemy nie są zgodne ze zdarzeniem (lub jeśli są one utrwalane po zaradczem), skontaktuj się z pomocą techniczną.
Jest to najważniejsza uwaga dla klientów, aby zrozumieć, co należy zrobić (lub nie robić) podczas zdarzenia. Jak wspomniano powyżej, podczas znanych problemów (na przykład w przypadku awarii wymienionej w usłudze Service Health) zdarzenie jest już opracowywane przez właściwych inżynierów — więc klienci nie muszą kontaktować się z pomocą techniczną w celu uzyskania aktualizacji. Będą otrzymywać regularne aktualizacje za pośrednictwem usługi Service Health (i ich alertów Kondycja usługi) i inżynierowie pomocy technicznej nie mają dostępu do bardziej szczegółowych informacji niż to, co jest udostępniane klientom, których dotyczy ten wpływ. Jeśli klienci odczytują aktualizacje z inżynierii, ale wymagają pomocy technicznej w odpowiedzi na zdarzenie (na przykład w celu wdrożenia planów trybu failover), mogą i powinni zgłosić bilet pomocy technicznej.
Podobnie, jeśli objawy, które zauważają, nie wydają się "w kolejce" z objawami opisanymi w aktualizacjach problemu (na przykład, jeśli występuje znany problem z pamięcią podręczną Redis Cache w regionie Wschodnie stany USA, ale występują problemy z pamięcią podręczną Redis Cache w regionie Wschodnie stany USA 2), może to być niepowiązane, a klienci mogą i powinni zgłosić bilet pomocy technicznej. Na koniec, jeśli problem z usługą zostanie rozwiązany/rozwiązany, ale klient nadal widzi problemy ze swoimi usługami, inżynierowie pomocy technicznej mogą pomóc im sprawdzić, czy istnieje coś specjalnego dzieje się ze swoimi zasobami, aby klienci mogli i powinni zgłosić bilet pomocy technicznej.