了解事件發生時該去何處以及預期情況

已完成

當我們談論「事件」時,我們會特別討論 Microsoft/Azure 端的問題,這是影響您服務的平台端問題。 在發生這些罕見但不可避免的問題期間,我們的目標是透過直接從工程師提供定期更新,盡可能對您保持透明。 我們努力透過正確的管道通知正確的人員,並盡可能分享詳細資料。

雖然我們通常不會分享疑難排解步驟的推測或內部工作,但我們會共用有關事件的所有資訊。 傳訊不會延遲 - 即使是詳細傳訊 - 根據客戶大小或區段,合作夥伴狀態或支援方案 – 因此 Microsoft 合作夥伴組織以及甚至是 Microsoft 帳戶小組都會同時收到通知,取得與他們所代表的受影響客戶相同的更新。

事件發生期間

  1. 檢閱 Azure 入口網站內的 Azure 服務健康狀態,以取得來自工程師的最新更新。

    如果您注意到問題且需要了解「是我們還是 Azure」,則檢查入口網站中的 Azure 服務健康狀態應該是第一個到訪地點。 雖然您應該注意此「必訪」地點,但如果您事先已經設定相關的服務健康狀態警示,即不需要反應性地搜尋資訊。 如果發生已知問題,這些服務健康狀態警示即會觸發,而且會使用所選擇的通訊管道來通知他們。

    注意

    提醒您,請設定服務健康狀態警示以透過您選擇的管道 (電子郵件、SMS、Webhook) 收到入口網站通訊的通知

  2. 如果存取服務健康狀態或入口網站本身時發生問題,請檢查公用 Azure 狀態頁面

    萬一發生服務問題導致您無法存取 Azure 入口網站中的服務健康狀態,則可以使用 azure.status.microsoft 發佈問題更新。 此頁面僅用於會中斷一般通訊路徑的問題,或用於罕見的普遍問題。

    需要提醒您的是,azure.status.microsoft 實際上是 Azure 服務健康狀態的備份。 我們大部分的服務問題通訊會以直接傳送至受影響的訂用帳戶或租用戶的目標式通知的形式提供。 這些會透過 Azure 入口網站中的 Azure 服務健康狀態傳遞,並會觸發任何已設定的 Azure 服務健康狀態警示。 公用狀態頁面 (azure.status.microsoft) 只會用於在三個特定案例下傳達服務問題:

    • 案例 1 - 包含多個地區、區域或服務的廣泛影響 - 服務問題對於整個地區或多個地區的多個服務造成廣泛/重大的客戶影響。 在此情況下,我們會通知您,因為客戶設定的復原能力 (例如高可用性或災害復原) 可能不足以避免所造成的影響。

    • 案例 2 - 無法存取 Azure 入口網站/服務健康狀態 - 服務問題會阻礙您存取 Azure 入口網站 或 Azure 服務健康狀態,因而影響了我們稍早所述的標準中斷通訊路徑。

    • 案例 3 - 服務影響,但不確定誰確實受到影響 – 服務問題具有廣泛的/重大客戶影響,但我們尚無法確認哪些客戶、地區或服務受到影響。 在此情況下,我們無法傳送目標式通訊,因此我們會提供公用更新。

  3. 如果 [狀態] 頁面發生問題,請透過 X 上的 @AzureSupport 檢查是否有任何更新

    在 Azure 的歷程記錄中,只發生過幾次技術問題,導致無法在 azure.status.microsoft 上張貼事件更新 - 在這些特殊情況下,我們會透過 X 在 @AzureSupport 張貼事件更新。 但無論出現什麼問題,客戶都應該隨時連絡 @AzureSupport,詢問和他們發現的潛在問題或支援方面的疑問有關的問題。 @AzureSupport 小組通常會在 5 分鐘內回覆 (我們對此感到非常自豪!),但請務必了解,如果發生已知問題 (例如,如果發生服務健康狀態中列出的中斷狀況),則事件已經由負責的工程師處理,因此除了將客戶導向到狀況說明的官方工程更新之外,@AzureSupport 小組可能無法再提供更多協助。

  4. 如果您的影響/問題與事件不相符 (或這些問題在風險降低之後持續發生),則請連絡客戶支援

    這是最重要的注意事項,可讓客戶了解事件發生期間應採取的動作 (或不應採取的動作)。 如上所述,如果發生已知問題 (例如,如果發生服務健康狀態中列出的中斷狀況),則事件已經由負責的工程師處理,因此客戶不需要連絡客戶支援即可取得更新。 他們會透過服務健康狀態 (及其 服務健康狀態警示) 收到定期更新,且支援工程師所取得的資訊不會比提供給受影響的客戶更詳細。 如果客戶已經讀取來自工程方面的更新,但還需要支援以回應事件 (例如,若要實作其容錯移轉方案),則他們可以且應該提出支援票證。

    同樣地,如果他們注意到的徵兆似乎和問題更新中所述的徵兆不「一致」(例如,如果在美國東部發生 Azure Cache for Redis 的已知問題,但他們查看的是美國東部 2 的 Azure Cache for Redis 問題),則可能是不相關的另一個問題,因此客戶可以且應該提出支援票證。 最後,如果服務問題已解決/緩解,但客戶仍然看到其服務出現問題,則支援工程師可以協助他們查看其資源是否有特殊情況,因此客戶可以且應該提出支援票證。

1.

如果您尚未設定相關的服務健康狀態警示,而且您注意到出現問題,則您首先應該在哪裡檢查此是否為 Azure 的問題?

2.

是非題:我們的公用狀態頁面 (azure.status.microsoft) 上會提供大部分的服務問題通訊。

3.

是非題:在 X 上關注 @AzureSupport 是了解是否發生 Azure 事件並持續掌握的最佳方式。