下列參考架構說明如何使用延展式叢集來設計和實作 Azure Local 的災害復原。
建築
下載此架構的 Visio 檔案。
元件
此架構包含下列元件和功能:
- Azure Stack HCI 版本 22H2。 Azure 本機 是超融合基礎結構 (HCI) 叢集解決方案,可用來裝載混合式內部部署環境中的虛擬化 Windows 和 Linux 工作負載及其記憶體。 您可以使用 4 到 16 個實體節點來設定延展式叢集。
- 記憶體複本。 記憶體復本是一種 Windows Server 技術,可在伺服器或叢集之間進行磁碟區復寫,以便進行災害復原。
- 即時移轉。 即時移轉是 Windows Server 中的 Hyper-V 功能,可讓您順暢地將執行中的虛擬機(VM)從一部 Hyper-V 主機移至另一部主機,而不會察覺到停機。
- 雲端見證。 雲端見證是故障轉移叢集仲裁見證,會使用 Microsoft Azure Blob 記憶體來提供叢集仲裁的投票。
案例詳細數據
您通常會使用此架構進行災害復原,並在5毫秒的往返網路等待時間範圍內,自動故障轉移 Azure 本機 VM 和檔案共用。
建議
下列建議適用於大部分案例。 除非您有覆寫建議的特定需求,否則請遵循建議。
使用延展式叢集為 Azure 本機上裝載的虛擬化工作負載和檔案共享實作自動化災害復原
若要增強 Azure Local 的內建復原能力,請實作由兩組節點組成的延展式 Azure 本機實例,每個月臺各有一個群組。 每個群組至少必須包含兩個節點。 叢集中的節點總數不能超過 Azure 本機實例所支援的節點數目上限。 節點必須滿足標準 HCI 硬體需求。
延展式 Azure 本機實例依賴記憶體複本,在各自實體站台中兩個節點群組所裝載的記憶體磁碟區之間執行同步記憶體複寫。 如果失敗會影響主要月臺的可用性,叢集會自動將其工作負載轉換為倖存站台中的節點,以將潛在的停機時間降到最低。 針對主要月臺的計劃性或預期停機,您可以使用 Hyper-V 即時移轉,順暢地將工作負載轉換為其他月臺,避免完全停機。 在此案例中,您應該注意儲存位置。 您應該先反轉記憶體複本的複寫方向,然後執行 VM 的即時移轉。 在即時移轉完成之前,將會有效能影響。
注意
同步復寫可確保在故障轉移期間文件系統層級發生零數據遺失的當機一致性。
謹慎
適用於延展式叢集的同步復寫需求會限制複寫站台中兩組叢集節點之間的往返網路等待時間 5 毫秒。 根據實體網路連線特性,此條件約束通常會轉譯為大約 20-30 個實體英里。
注意
記憶體複本的簽署和加密功能會自動保護複寫流量。
考慮
這些考慮會實作 Azure Well-Architected Framework 的要素,這是一組可用來改善工作負載質量的指導原則。 如需詳細資訊,請參閱 Microsoft Azure Well-Architected Framework。
可靠性
可靠性可確保您的應用程式可以符合您對客戶的承諾。 如需詳細資訊,請參閱 可靠性的設計檢閱檢查清單。
- 月臺層級容錯網域。 Azure 本機延展式叢集的每個實體網站都代表不同的容錯網域,可提供額外的復原能力。 容錯網域是一組共用單一失敗點的硬體元件。 若要讓特定層級容錯,您需要該層級的多個容錯網域。
注意
如果每個位置對應至個別的AD DS月臺,叢集布建程式會自動設定月臺指派。 如果沒有代表兩個位置的個別 AD DS 月臺,但節點位於兩個不同的子網上,則叢集佈建程式會根據子網指派來識別月臺。 如果節點位於相同的子網上,您必須明確定義月臺指派。
網站感知。 網站感知可讓您藉由指定其慣用的網站來控制虛擬化工作負載的位置。 指定延展式叢集的慣用月臺提供許多優點,包括能夠將月臺層級的工作負載分組,以及自定義仲裁投票選項。 根據預設,在冷啟動期間,所有虛擬機都會使用慣用月臺,不過您也可以在叢集角色或群組層級設定慣用月臺。 這可讓您以主動-主動模式將特定虛擬機配置給各自的月臺。 從仲裁的觀點來看,慣用的網站選擇會以偏愛該網站的方式影響選票的配置。 例如,如果裝載延展式叢集節點的兩個月臺之間的連線失敗,且無法連線到叢集見證,則慣用的網站會維持在在線,而其他站台中的節點則會收回。
改善儲存空間直接存取磁碟區修復速度。 儲存空間直接存取會提供自動重新同步處理下列事件,以影響其存放集區內磁碟的可用性,例如關閉其中一個叢集節點或本地化的硬體失敗。 Azure Local 會實作 增強的重新同步處理,其運作粒度比 Windows Server 2019 更精細。 此程式可大幅降低重新同步作業的持續時間,並將多個重疊硬體失敗的潛在影響降到最低。
復原限制。 Azure 本機提供多個層級的復原功能,但由於其超交集架構,復原不僅受限於 叢集仲裁,而且受限於 集區仲裁。
與一系列提供額外復原優勢的 Azure 服務整合。 您可以將在 Azure 本機實例上執行的虛擬化工作負載與 Azure 備份
等 Azure 服務整合, Azure Site Recovery 。加速故障轉移。 您可以將網路基礎結構及其設定優化,以加速完成月臺層級故障轉移。 例如,您可以在代表叢集資源的 DNS 記錄中利用延展虛擬 LAN(VLAN)、網路抽象裝置,以及較短的存留時間 (TTL) 值。 此外,請考慮降低 預設復原期間,這會決定允許叢集 VM 以隔離狀態執行的時間週期。
謹慎
搭配 SDN 使用 Stretched 叢集會被視為進階設定,您應該連絡系統整合者或Microsoft支援以取得進一步協助。
安全
安全性可提供針對蓄意攻擊和濫用寶貴數據和系統的保證。 如需詳細資訊,請參閱 安全性的設計檢閱檢查清單。
傳輸中的保護。 儲存器複本為其復寫流量提供內建安全性,包括封包簽署、AES-128-GCM 完整數據加密、支援 Intel AES-NI 加密加速,以及預先驗證完整性攔截式攻擊防護。 記憶體複本也會利用 Kerberos AES256 進行復寫節點之間的驗證。
待用加密。 Azure Local 支援 BitLocker 磁碟驅動器加密的數據磁碟區,從而促進 FIPS 140-2 和 HIPAA 等標準的合規性。
與一系列提供額外安全性優點的 Azure 服務整合。 您可以將在 Azure 本機實例上執行的虛擬化工作負載與適用於雲端的 Defender Microsoft Defender 等 Azure 服務整合
防火牆易記的設定。 儲存器複本流量需要 複寫節點之間的開啟埠數目有限,。
謹慎
記憶體複本和 Azure 本機延展式叢集必須在 AD DS 環境中運作。 規劃 Azure 本機延展式叢集部署時,請確定每個裝載叢集節點的站台中 AD DS 域控制器的連線能力。
成本優化
成本優化是考慮如何減少不必要的費用,並提升營運效率。 如需詳細資訊,請參閱 成本優化的設計檢閱檢查清單。
主動-主動與主動-被動設定。 延展式 Azure 本機實例支持主動-被動和主動-主動模式。 在主動-被動模式中,指定的主要月臺會單向複寫到另一個提供災害復原功能的月臺。 在主動-主動模式中,兩個月臺會單向複寫各自的磁碟區,以在任一月台失敗時提供故障轉移功能。 主動-主動模式可藉由消除專用災害復原網站的需求,協助將商務持續性成本降到最低。
雲端見證與檔案共享見證。 見證資源是 Azure 本機實例內的必要元件。 若要實作,請選擇 Azure 雲端見證或檔案共享見證。 Azure 雲端見證依賴您指定為仲裁點的 Azure 記憶體帳戶中的 Blob,以防止分割腦案例。 檔案共用見證依賴伺服器消息塊 (SMB) 檔案共用來完成相同的目標。
注意
Azure 雲端見證是 Azure 本機延展式叢集的建議選擇,前提是叢集中的所有伺服器節點都有可靠的因特網連線。 對應的 Azure 費用可忽略;它們是以小型 Blob 的價格為基礎,其不常更新會對應至叢集狀態的變更。 在牽涉到延展式叢集的案例中,檔案共用見證應該位於第三個網站中,除非第三個月臺已可供使用,而且具有裝載延展式叢集節點之月臺的現有可靠連線,否則可能會大幅提高實作成本。
- 重複資料刪除。 Azure 本機和記憶體複本支援重複資料刪除。 從 Windows Server 2019 開始,重複資料刪除可在使用彈性文件系統 (ReFS) 格式化的磁碟區上使用,這是 Azure 本機的建議文件系統。 重複資料刪除有助於藉由識別檔案的重複部分,並只儲存一次,來增加可使用的儲存容量。
謹慎
雖然您應該在來源和目的地伺服器上安裝重複數據刪除伺服器角色服務,但請勿在 Azure 本機延展式叢集內的目的地節點上啟用重複數據刪除。 因為重複數據刪除會管理寫入,所以它應該只在來源叢集節點上執行。 目的地節點一律會收到每個磁碟區的重複數據刪除複本。
卓越營運
卓越營運涵蓋部署應用程式的作業程式,並讓它在生產環境中執行。 如需詳細資訊,請參閱 Operational Excellence的設計檢閱檢查清單。
自動故障轉移和復原。 主要月台失敗會觸發自動故障轉移。 在故障轉移之後,從新的主要/先前次要月臺建立複寫到新的次要/前主要月臺的程式也是自動的。 為了防止潛在的數據遺失,叢集會防止容錯回復,直到複寫的磁碟區完全同步處理為止。
使用 Windows Admin Center 簡化佈建和管理體驗。 Windows Admin Center 中的建立叢集精靈提供精靈驅動介面,引導您完成建立 Azure 本機延展式叢集的程式。 精靈會偵測叢集節點是否位於兩個不同的 Active Directory 網域服務 (AD DS) 月臺,或其 IP 位址是否屬於兩個不同的子網。 如果它們位於兩個不同的子網中,精靈會自動建立並設定對應的叢集月臺,每個月臺都代表個別的容錯網域。 它也可讓您指定慣用的網站。 同樣地,Windows Admin Center 可簡化布建複寫磁碟區的程式。
注意
針對延展式叢集建立磁碟區和虛擬磁碟比單一月臺叢集更相關。 延展式叢集至少需要四個磁碟區,其中包含兩個數據磁碟區和兩個記錄磁碟區,每個月臺都有一個數據/記錄磁碟區組。 當您使用 Windows Admin Center 建立復寫的數據磁碟區時,此程式會自動在主要站台中布建記錄磁碟區,以及次要站台中的數據和記錄復寫磁碟區,確保每個磁碟區都有所需的大小和組態設定。
支援使用 Windows PowerShell 自動延展式叢集布建 和 記憶體管理。 您可以從其中一部 Azure 本機電腦或從管理計算機遠端執行 PowerShell。
與一系列提供額外作業優勢的 Azure 服務整合。 您可以將在 Azure 本機實例上執行的虛擬化工作負載與 Azure 監視器 和 Azure 自動化解決方案等 Azure 服務整合,包括
變更追蹤和清查 和更新管理 。 遵循初始強制註冊程序之後,Azure 本機實例可以利用 Azure Arc 進行監視和計費。 Azure Arc 整合提供與其他混合式服務的增強整合,例如 Azure 原則 和 Log Analytics。 註冊會觸發建立代表 Azure 本機實例的 Azure Resource Manager 資源,有效地將 Azure 管理平面延伸至 Azure 本機。
效能效率
效能效率是工作負載以有效率的方式符合其需求的能力。 如需詳細資訊,請參閱 效能效率的設計檢閱檢查清單。
- 優化的復寫流量。 設計 Azure 本機延展式叢集的基礎結構時,請考慮在月臺之間流動的其他記憶體複本、即時移轉和記憶體複本叢集效能歷程記錄流量。 同步復寫需要延展式叢集網站之間的至少 1 Gb 遠端直接記憶體存取 (RDMA) 或乙太網路/TCP 連線。 不過,視復寫流量而定,您可能需要 更快的 RDMA 連線。 您也應該在網站之間布建多個連線,以提供復原優點,並可讓您 個別的記憶體複本流量,Hyper-V 即時移轉流量。
謹慎
默認會針對相同子網上相同站台中叢集節點之間的所有流量啟用 RDMA。 RDMA 已停用,且月臺之間或不同子網之間不支援。 您應該停用跨網站流量的SMB直接存取,或實作 將它與相同月臺內的跨節點流量分開的其他布建。
種子初始同步處理的支援。 您可以在初始同步時間必須最小化或裝載延展式叢集的兩個月臺之間有有限的頻寬的情況下,實作植入的初始同步處理。
記憶體 I/O 的優化處理。 確保 復寫數據和記錄磁碟區的最佳設定,包括其效能層級、磁碟區和扇區大小調整、磁碟類型和文件系統。
注意
如果您使用 Windows Admin Center 布建延展式叢集磁碟區,則會自動指派最佳設定。
後續步驟
- Azure 本機解決方案概觀
- 在 Windows Server 和 Azure 本機 中
故障轉移叢集 - 部署故障轉移叢集的雲端見證
- Azure 本機 的新功能
- Azure 本機常見問題
相關資源
- 混合式架構設計
- Azure 混合式選項
- 針對遠程辦公室或分公司使用 Azure 本機無交換互連和輕量仲裁
- 使用 Azure Arc 優化內部部署和多重雲端環境中的 SQL Server 實例管理
- Azure 自動化狀態設定