概觀
本系列提供一個說明範例,說明組織如何為 Azure 企業數據平台設計災害復原(DR)策略。
- 這一系列文章補充Microsoft 雲端採用架構、Azure 架構完善的架構架構和商務持續性管理所提供的指引。
Azure 提供廣泛的復原選項,可在發生災害時提供服務持續性。 但較高的服務等級可能會帶來複雜度和成本進階。 成本與復原與複雜性的取捨,是大多數客戶對於DR的關鍵決策因素。
雖然偶爾會在 Azure 平臺上發生點失敗,但Microsoft的 Azure 數據中心和 Azure 服務內建了多層備援。 任何失敗通常會限制在範圍內,而且通常會在數小時內補救。 在過去,身分識別管理等重要服務更有可能遇到服務問題,而不是整個 Azure 區域離線。
也應該承認,網路攻擊,特別是勒索軟體,現在對任何現代數據生態系統構成有形的威脅,並可能導致數據平台中斷。 雖然此系列的範圍不足,但建議客戶實作控制這類攻擊,作為任何數據平臺安全性和復原設計的一部分。
- Azure 雲端基本概念中 提供勒索軟體保護的Microsoft指導方針
範圍
本文系列的範圍包括:
- 客戶之說明角色的實體災害,從實體災害中復原 Azure 數據平台的服務。 此說明客戶為:
- 具有已定義作業支援功能的中型組織,遵循以資訊技術基礎結構連結庫 (ITIL) 為基礎的服務管理方法。
- 非雲端原生,其核心企業共用服務,例如存取和驗證管理和事件管理,其餘在內部部署。
- 在雲端移轉至 Azure 的旅程中,由自動化啟用。
- Azure 數據平臺已在客戶的 Azure 租用內實作下列設計:
- 企業登陸區域 – 提供平台基礎,包括網路功能、監視、安全性等等。
- Azure 分析平臺 - 提供資料元件,以支援服務所提供的各種解決方案和數據產品。
- 本文所述的程式將由 Azure 技術資源執行,而不是專家 Azure 主題專家(SME)。 因此,資源應該具有下列層級的知識/技能:
- Azure 基本概念 – 瞭解 Azure、其核心服務和數據元件。
- Azure DevOps 的工作知識。 能夠巡覽原始檔控制並執行管線部署。
- 本文所述的此程式涵蓋從主要區域到次要區域的服務故障轉移作業。
超出範圍
本文系列將下列專案視為範圍不足:
- 從次要區域回到主要區域的後援程式。
- 任何非 Azure 應用程式、元件或系統 – 這包括但不限於內部部署、其他雲端廠商、第三方 Web 服務等等。
- 復原任何上游服務,例如內部部署網路、閘道、企業共用服務和其他服務,不論這些服務的任何相依性為何。
- 復原任何下游服務,例如內部部署操作系統、第三方報告系統、數據模型化或數據科學應用程式,以及其他服務,不論這些服務有任何相依性。
- 數據遺失案例,包括從 勒索軟體或類似的數據安全性事件復原
- 數據備份策略和數據還原計劃
- 建立DR事件的根本原因。
- 針對 Azure 服務 /元件事件,Microsoft 在狀態 – 歷程記錄網頁中 發佈「根本原因分析」
重要假設
此DR工作範例的主要假設如下:
- 組織遵循 ITIL 型服務管理方法,以取得 Azure 數據平臺的操作支援。
- 組織有現有的災害復原程式,作為IT資產服務還原架構的一部分。
- 基礎結構即程式代碼 (IaC) 已用來部署自動化服務所啟用的 Azure 數據平臺,例如 Azure DevOps 或類似專案。
- Azure 數據平臺所裝載的每個解決方案都已完成商務影響評估或類似專案,為恢復點目標 (RPO)、復原時間目標 (RTO) 和平均復原時間計量提供明確的服務需求。
下一步
現在您已瞭解高階案例,接下來您可以繼續了解 專為使用案例設計的架構 。