識別正確的災害復原案例
您的組織必須準備正確的嚴重損壞修復保護,以限制資料中心失敗或區域中斷的影響。 設定正確的保護策略主要取決於可能影響您的 Azure 虛擬桌面功能的不同失敗案例之一。
目標和衡量標準
嚴重損壞修復流程需要協調每個執行的程序,讓組織恢復完整作業。 將這些程序統合在一起,是存在通用、明確定義的服務層級目標。 災害復原 (DR) 服務應包含下列計量:
- 復原點目標(RPO): 根據視為已復原的備份資產,您必須將服務傳回給用戶端的最小允許資料量。 相反地,此數量可視為可接受的資料遺失上限,以從 100 減去的百分比表示。
- 復原時間目標 (RTO): 允許還原程式進行的視窗時間上限,這也可能被視為組織願意承受多少停機時間的量值。
- 保留期間: 備份組需要重新更新和取代之前,保留的允許時間上限。
RPO 和 RTO 可能會被視為彼此平衡,因此客戶可能會決定允許較長的復原時間,以取得較高的復原點。 如果客戶因為可用的頻寬或停機的風險而造成復原時間的問題,則該客戶可能無法達到高 RPO。
本單元的其餘部分會探索三種不同的失敗案例,以及如何準備 Azure 虛擬桌面的商務持續性和嚴重損壞修復 (BCDR):
- 案例 1:資料、中繼資料或資源的局部損壞
- 案例 2:Azure 區域中可用性區域失敗的單一資料中心
- 案例 3:Azure 區域中斷
注意事項
要深入瞭解如何保護 Azure 虛擬桌面的個別元件,請參閱此模組摘要單元中的「深入瞭解」一節。
案例 1:資料、中繼資料或資源的局部損壞
假設您的 Azure 虛擬桌面環境受到工作階段主機失敗或 FSLogix 設定檔損壞的影響。 在這種情況下,最常見的復原方法是從備份還原設定檔,或重建工作階段主機。 此單位會逐一檢視這些方法如何適用于每個 Azure 虛擬桌面環境元件。
Azure 虛擬桌面服務
Azure 虛擬桌面服務維持完整功能,不受這些失敗類型影響。 Microsoft 負責讓所有專案在提供的服務等級協定(SLA) 內恢復運作。
AD DS 和 Microsoft Entra Domain Services
Active Directory 網域控制站是 Azure 虛擬桌面的重要元件,必須永遠可供使用。 若要確保存取失敗不會影響其功能,請確定您已建立多個網域控制站。 如果您在 Azure 虛擬機中有域控制器,請確定您已將它們設定為位於相同的可用性設定組中。 如果您的網域控制站以內部部署電腦執行,您應該以備援設計內部部署網路和 Azure 虛擬網路之間的連線。 使用 Azure ExpressRoute 來管理重複的路徑和連接。 備份 Active Directory 系統狀態,並還原 (如有必要)。 如果您使用 Microsoft Entra Domain Services,Microsoft 會負責維護備援域控制器,並協助保護它們免於發生非計劃性失敗。
主機集區
主機集區在一般作業過程中可能會無法使用。 主機集區會為使用者提供 Azure 虛擬桌面和應用程式。 它們是從桌面影像設定,因此如果發生失敗且有可用的桌面影像,您可以將它們重新產生。 您也可以針對透過 Azure 虛擬桌面使用的應用程式,使用個別的主機集區。 您也應該考慮此主機集區的類似嚴重損壞修復方法。
虛擬網路
虛擬網路是受管理的服務,不受這種類型的失敗影響。 Azure 虛擬網路提供私人 IP 區塊,您可以在其中部署所有資源進行私人連線,然後您可以在界限內保護這些資源。 因此,如果資源在單一資料中心發生區域失敗,虛擬網路永遠不會中斷或發生中斷。
FSLogix 設定檔和 MSIX 應用程式連結
根據您的 FSLogix 儲存技術選擇,您可以設定 Azure 檔案共用和 Azure NetApp 檔案快照集的 Azure 備份。 或者,您可以使用備份服務來保護伺服器 VM 上的檔案和資料夾。
影像
在 Azure 虛擬桌面環境維護的一般過程中,您通常會變更桌面影像。 您應該維護映像的備份,以便在發生任何損毀時快速復原。
案例 2:Azure 區域中可用性區域失敗的單一資料中心
Azure 區域是一組資料中心,部署在延遲定義的周邊內,並透過專用的區域低延遲網路進行連線。 如果 Azure 區域中的資料中心或區域中斷,適用於 Azure 虛擬桌面的 BCDR 應包括下列各節所列的建議。
Azure 虛擬桌面服務
Azure 虛擬桌面服務維持完整功能,不受這類失敗影響。 Microsoft 負責讓所有專案在提供的 SLA 內恢復運作。
AD DS 和 Microsoft Entra Domain Services
若要避免單一資料中心失敗,請至少將兩個網域控制站部署在可用性區域中。 如果您使用 Microsoft Entra Domain Services,如果區域支援,Microsoft 會在個別的可用性區域中管理租使用者的兩個域控制器。
主機集區
針對主機集區 VM 復原,您可以使用 VM 的可用性區域來部署 Azure 虛擬桌面主機集區。 您可以將主機集區的 VM 分散到仍位於相同區域的不同資料中心。
虛擬網路
虛擬網路是受管理的服務,不受此失敗類型影響。 您應該確保一直以適當的網路連線能力來配置可靠的資源。 例如,使用基本負載平衡器可能會受到這類失敗的影響,因為它不支援區域可用性。
FSLogix 設定檔和 MSIX 應用程式連結
以 Premium 區域備援儲存空間使用 Azure 檔案,以運用可用性區域的支援。 在此案例中,如果資料中心中斷,FSLogix 設定檔和 MSIX 應用程式連結 VHD 仍然可以使用。
影像
這種失敗不會影響影像,因為影像可在另一個區域中使用。
案例 3:Azure 區域中斷
完整 Azure 區域失敗的可能性極小且罕見。 但您也應該做好準備,以防發生這類失敗。 請考慮執行下列建議,以針對 Azure 虛擬桌面執行 BCDR。
Azure 虛擬桌面服務
Azure 虛擬桌面服務仍保持完整功能,不受這類失敗影響。 Microsoft 負責讓所有專案在提供的 SLA 內恢復運作。
AD DS 和 Microsoft Entra Domain Services
若要準備這種類型的失敗,您可以展開受控網域,為每個 Microsoft Entra 租使用者設定一個以上的複本。 復本集可以新增至任何支援 Microsoft Entra Domain Services 之 Azure 區域中的任何對等互連虛擬網路。
如果您使用內部部署域控制器,您必須使用 VPN、ExpressRoute 或虛擬廣域網 (虛擬 WAN) ,來設定新區域中虛擬網路的連線。 如果您使用 Microsoft Entra Domain Services,您可以在另一個區域中建立額外的複本集。 裝載新復本集之其他區域中的虛擬網路必須能夠與裝載 Microsoft Entra Domain Services 主要集合的網路通訊。 建議您在虛擬網路之間使用對等,在複本集之間進行內部站台複寫。
主機集區
您可以在 主動-主動 和 主動-被動 組態中部署 Azure 虛擬桌面主機集區:
主動/主動:使用主動式組態時,單一主機集區可以有多個區域的 VM。 您必須結合雲端快取記憶體功能,以在多個區域的儲存空間上主動複寫使用者的 FSLogix 設定檔。 針對 MSIX 應用程式附加,請在另一個區域的其他檔案共用上使用另一個複本。 每個地區的 VM 應包含雲端快取記憶體註冊以指定位置。 此外,您必須設定群組原則,以將優先順序設定為本機儲存位置。 從使用者的觀點來看,此 Azure 虛擬桌面部署可提供最高的效率。 這是因為如果發生失敗,其餘地區的使用者可以繼續使用服務,而不需要再次登錄。 不過,此組態的部署成本比較高且更複雜,且未針對性能優化。
主動/被動: 對於主動/被動組態,您可以使用 Azure Site Recovery 以網域控制站複寫次要地區的 VM。 如果您使用 Azure Site Recovery,則不需要手動註冊 VM。 相反地,次要 VM 中的 Azure 虛擬桌面代理程式會自動使用最新的安全性令牌來連線到最接近它的服務實例。 這可確保您的會話主機會自動加入主機集區,而且使用者只需要重新連線才能存取其 VM。 針對此組態,您也可以在容錯移轉區域建立次要主機集區 (稱為 熱待命),並關閉所有資源。 然後,您可以使用 Azure Site Recovery 中的復原計畫來開啟主機集區,並建立一個協調的流程。 您也需要在容錯移轉區域建立新應用程式群組,並將使用者指派給他們。
虛擬網路
區域失敗會影響虛擬網路和虛擬網路內部部署的服務。 您必須規劃次要地區的虛擬網路。 您可以手動建立虛擬網路,然後使用與主要網路對等進行設定。 您也可以使用 Azure Site Recovery 在容錯移轉區域設定虛擬網路,並保留主要網路的設定。
在已與內部部署網路連線的 Azure 虛擬桌面中,您應該設定次要地區的虛擬網路與內部部署網路的連線。
FSLogix 設定檔和 MSIX 應用程式連結
您可以使用 Azure NetApp 檔案做為 FSXlogix 設定檔和 MSIX 應用程式連結的儲存選項,因為它們支援跨區域複寫。 具有標準效能的 Azure 檔案也支援跨區域複寫。 您可以將 FSLogix 代理程式設定為支援多個設定檔位置,這有助於確保發生失敗時的可用性。 如果主要位置失敗,FSLogix 代理程式會復寫為 VM Azure Site Recovery 的一部分。 代理程式會自動嘗試使用指向次要區域的配置檔路徑。
針對主動式案例,如果 RTO/RTA 少於一天,建議您使用 FSLogix 設定檔來使用雲端快取記憶體。 雲端快取記憶體是 FSLogix 的一項功能,必須特別啟用和配置。 它可讓您使用多個遠端位置,這些位置在使用者工作階段都會持續更新。
影像
在修改每個主要桌面映射之後,您應該復寫次要區域中的映像。 您可以使用 Azure 計算資源庫跨區域共用自訂映像。 在主要區域失敗期間,您可以使用複製的桌面影像做為建立主機集區的來源。
應用程式依存性
相依於主要區域中可用資源的應用程式,在次要位置中需要相同的資源。 例如,如果您的部分應用程式與部署在一個地區的 SQL 後端連接,請務必在次要位置複寫 SQL。 針對 Azure 虛擬機器上的 SQL Server,您可以使用 Azure Site Recovery。 對於 SQL 作為平台即服務 (PaaS) 解決方案,您可以使用作用中的地理位置複寫或自動容錯移轉群組。 您應該將這些資源納入整體 BCDR 計畫中。 此外,您應該包括 Azure Site Recovery 計畫,以在保護計劃中建立應用程式相依性模型。