了解 Microsoft 365 復原

已完成

復原能力是 Microsoft 365 結構和服務設計的另一個關鍵設計原則。 Microsoft 設計和建置雲端服務來最大化可靠性,並盡可能降低客戶面對日常作業的錯誤和挑戰時造成的負面影響。 Microsoft 會直接在線上服務中建立備援,而不是依賴涉及複雜實體基礎結構的傳統復原策略。 我們結合備援基礎結構與智慧型軟體來最大化資料復原能力、避免停機時間,以及達到 99.9% 的可用性 SLA。

服務復原

Microsoft 365 的復原策略會以軟體復原為第一優先。 這表示我們著重於將復原能力建置在我們的服務設計中,無論基礎硬體發生何種失敗,我們都能避免服務出現停機時間。 服務復原可讓我們的服務自動從多種錯誤和失敗中復原,而不會影響服務可用性。

Microsoft 365 服務會實作一些復原原則,包括:

  • 主動/主動服務設計:我們會盡可能確保服務在設計和部署時具有主動/主動復原能力。 這表示如果服務的重要元件故障,則相同的元件可供接管,而不會影響可用性。
  • 錯誤隔離透過防止某個元件中的錯誤導致其他元件跟著失敗,以改善服務復原能力。 Microsoft 365 會持續努力降低服務中的錯誤區域大小,以避免失敗擴散並影響其他系統元件。 例如,Exchange Online 資料庫可用性群組會將服務內失敗的影響限制為特定可用性群組。
  • 監視和自我修復:Microsoft 365 服務採用各種自動化機制來持續監視我們的服務健康情況,並將流量路由至最佳服務叢集。 我們的許多服務都包含偵測到問題時可自我修復的機制。 例如,如果 Exchange Online 偵測到會影響可用性群組的磁碟失敗,則會自動還原信箱資料庫。

資料復原

資料復原可藉由保護 Microsoft 365 服務中資料的完整性和可用性,來加強服務復原能力。 Microsoft 365 資料復原著重於確保發生非預期錯誤和失敗時,重要的客戶資料仍然可用且不會遭到修改。 為了達到此目的,Microsoft 365 服務會實作下列資料復原原則:

  • 資料重要性:我們的服務旨在保護重要的客戶資料。 為了達到此目的,我們會將系統處理的資料分為重要或不重要。 在少數的失敗情況下,我們可能會丟棄不重要的資料 (例如是否已讀取郵件)。 重要資料 (例如客戶資料) 則會在失敗發生期間受到保護,以避免遺失。
  • 資料備援:我們的服務會使用本機儲存體備援和異地備援,將客戶資料的複本複寫到不同的錯誤區域。 如果資料在一個錯誤區域中損毀或遺失,您可以在另一個錯誤區域中存取這些資料,而不會失去可用性。
  • 細微監視和自動復原:我們的系統會監視客戶資料完整性,並自動還原損毀的資料。 例如,Exchange Online 會監視多個層級上的資料損毀情況,並自動還原發生損毀的資料庫或信箱。
  • 防止資料意外遺失:大部分的資料遺失都是客戶動作所造成。 Microsoft 365 會為客戶提供工具,讓他們能夠復原 Exchange Online 和 SharePoint Online 中意外刪除或修改的資料。

網路復原

Microsoft 擁有且操作著全球其中一個最大的骨幹網路,可連結 54 個全球化地區中的數百個資料中心。 我們的網路由數十萬公里的私人光纖提供支援,可在世界各地提供接近完美的可用性、高容量和網路靈活性。

我們的 Microsoft 資料中心網路在設計上皆以接近客戶為主,並運用數百個邊緣節點來維護服務可用性。 網路架構包括直接互連和多個網路路徑。 利用此備援,我們的服務會自動路由失敗項目周遭的流量來改善服務品質。 此外,我們的網路可讓我們直接控制網路容量,而且我們使用「軟體定義網路」來主動管理大規模的網路流量,為的就是將效能和復原能力最大化。

共同責任和相依性

在雲端環境中,復原能力是雲端提供者和客戶之間的共同責任。 雖然 Microsoft 365 致力於其服務和網路的復原,但客戶必須了解其責任和相依性,才能確保服務的可用性。

客戶對於復原的責任會根據特定 Microsoft 365 產品和特定客戶設定而不同,但通常包括:

  • 維護 Microsoft 365 訂閱的授權。
  • 從終端使用者裝置維護適當的網路連線能力。
  • 訓練使用者了解保留和復原原則,以及使用保留功能。
  • 在相關服務的服務保留時間內初始化資料復原。
  • 管理及維護任何內部部署目錄。
  • 檢閱並解決 Azure AD 同步錯誤。
  • 開發及採用緊急應變原則 (例如,設定緊急系統管理員存取帳戶)。
  • 管理和確保客戶 HSM 的連線能力和功能

深入了解