Die folgende Referenzarchitektur veranschaulicht, wie Sie die Notfallwiederherstellung von Azure Local mithilfe von gestrecktem Clustering entwerfen und implementieren.
Architektur
Laden Sie eine Visio-Datei dieser Architektur herunter.
Komponenten
Die Architektur enthält die folgenden Komponenten und Funktionen:
- Azure Stack HCI, Version 22H2. Azure Local ist eine HCI-Clusterlösung (Hyperconverged Infrastructure), mit der Sie virtualisierte Windows- und Linux-Workloads und deren Speicher in einer lokalen Hybridumgebung hosten können. Sie können den gestreckten Cluster mit 4 bis 16 physischen Knoten konfigurieren.
- Speicherreplikat. Speicherreplikat ist eine Windows Server-Technologie, die die Volumereplikation zwischen Servern oder Clustern zum Zweck der Notfallwiederherstellung ermöglicht.
- Livemigration. Die Livemigration ist ein Hyper-V-Feature in Windows Server, mit dem Sie problemlos ausgeführte virtuelle Computer (VMs) von einem Hyper-V Host auf einen anderen verschieben können, ohne dass Ausfallzeiten wahrgenommen werden.
- CloudZeugen. CloudZeuge ist ein Failovercluster-Quorumzeuge, der Microsoft Azure Blob Storage verwendet, um eine Abstimmung über das Cluster quorum bereitzustellen.
Szenariodetails
In der Regel verwenden Sie diese Architektur für die Notfallwiederherstellung mit automatischem Failover von lokalen Azure-VMs und Dateifreigaben zwischen zwei physischen Standorten innerhalb eines Bereichs von 5 ms Roundtrip-Netzwerklatenz.
Empfehlungen
Die folgende Empfehlung gilt für die meisten Szenarien. Befolgen Sie die Empfehlung, es sei denn, Sie haben eine bestimmte Anforderung, die sie außer Kraft setzt.
Verwenden von gestreckten Clustern zum Implementieren der automatisierten Notfallwiederherstellung für virtualisierte Workloads und Dateifreigaben, die auf Azure Local gehostet werden
Um die integrierte Ausfallsicherheit von Azure Local zu verbessern, implementieren Sie eine gestreckte lokale Azure-Instanz, die aus zwei Gruppen von Knoten besteht, mit einer Gruppe pro Standort. Jede Gruppe muss mindestens zwei Knoten enthalten. Die Gesamtzahl der Knoten in einem Cluster darf nicht die maximale Anzahl von Knoten überschreiten, die von einer lokalen Azure-Instanz unterstützt werden. Die Knoten müssen die Standard-HCI-Hardwareanforderungenerfüllen.
Eine gestreckte lokale Azure-Instanz basiert auf dem Speicherreplikat, um eine synchrone Speicherreplikation zwischen Speichervolumes durchzuführen, die von den beiden Knotengruppen an ihren jeweiligen physischen Standorten gehostet werden. Wenn sich ein Fehler auf die Verfügbarkeit des primären Standorts auswirkt, übergibt der Cluster seine Workloads automatisch auf Knoten am überlebenden Standort, um potenzielle Ausfallzeiten zu minimieren. Bei geplanten oder erwarteten Ausfallzeiten am primären Standort können Sie Hyper-V Livemigration verwenden, um Arbeitslasten nahtlos an den anderen Standort umzustellen und Ausfallzeiten vollständig zu vermeiden. Für dieses Szenario sollten Sie den Speicherort berücksichtigen. Sie sollten zuerst die Replikationsrichtung für das Speicherreplikat umkehren und dann die Livemigration der virtuellen Computer durchführen. Es tritt eine Leistungsbeeinträchtigung auf, bis die Livemigration abgeschlossen ist.
Anmerkung
Die synchrone Replikation gewährleistet die Absturzkonsistenz mit null Datenverlust auf Dateisystemebene während eines Failovers.
Vorsicht
Die synchrone Replikationsanforderung für gestreckte Cluster erzwingt eine Grenze von 5 ms Roundtrip-Netzwerklatenz zwischen zwei Gruppen von Clusterknoten an den replizierten Standorten. Abhängig von den Merkmalen der physischen Netzwerkkonnektivität wird diese Einschränkung in der Regel in etwa 20-30 physische Meilen übersetzt.
Anmerkung
Die Signatur- und Verschlüsselungsfunktion des Speicherreplikats schützt automatisch den Replikationsverkehr.
Betrachtungen
Diese Überlegungen implementieren die Säulen des Azure Well-Architected-Frameworks, das eine Reihe von leitden Tenets ist, die verwendet werden können, um die Qualität einer Workload zu verbessern. Weitere Informationen finden Sie unter Microsoft Azure Well-Architected Framework.
Zuverlässigkeit
Zuverlässigkeit stellt sicher, dass Ihre Anwendung die Verpflichtungen erfüllen kann, die Sie an Ihre Kunden vornehmen. Weitere Informationen finden Sie unter Prüfliste zur Entwurfsüberprüfung für Zuverlässigkeit.
- Fehlerdomänen auf Websiteebene. Jeder physische Standort eines lokalen gestreckten Azure-Clusters stellt unterschiedliche Fehlerdomänen dar, die zusätzliche Resilienz bieten. Eine Fehlerdomäne ist eine Reihe von Hardwarekomponenten, die einen einzelnen Fehlerpunkt gemeinsam nutzen. Um fehlertolerant auf einer bestimmten Ebene zu sein, benötigen Sie mehrere Fehlerdomänen auf dieser Ebene.
Anmerkung
Wenn jeder Standort einem separaten AD DS-Standort entspricht, konfiguriert der Clusterbereitstellungsprozess automatisch die Standortzuweisung. Wenn keine separaten AD DS-Standorte vorhanden sind, die die beiden Speicherorte darstellen, die Knoten sich jedoch auf zwei verschiedenen Subnetzen befinden, identifiziert der Clusterbereitstellungsprozess Standorte basierend auf den Subnetzzuweisungen. Wenn sich die Knoten im selben Subnetz befinden, müssen Sie die Standortzuweisung explizit definieren.
Websitebewusstsein. Mithilfe des Websitebewusstseins können Sie die Platzierung virtualisierter Workloads steuern, indem Sie ihre bevorzugten Websites entwerfen. Die Angabe der bevorzugten Website für einen gestreckten Cluster bietet viele Vorteile, einschließlich der Möglichkeit, Workloads auf Standortebene zu gruppieren und quorum-Abstimmungsoptionen anzupassen. Standardmäßig verwenden alle virtuellen Computer während eines Kaltstarts den bevorzugten Standort, obwohl es auch möglich ist, den bevorzugten Standort auf Clusterrolle oder Gruppenebene zu konfigurieren. Auf diese Weise können Sie bestimmte virtuelle Computer ihren jeweiligen Websites im aktiven Modus zuordnen. Aus der Kollegiumsperspektive wirkt sich die bevorzugte Websiteauswahl auf die Zuweisung von Stimmen in einer Weise aus, die diese Website bevorzugt. Wenn beispielsweise die Verbindung zwischen den beiden Standorten, an denen gestreckte Clusterknoten gehostet werden, fehlschlägt und der Clusterzeuge nicht erreichbar ist, bleibt die bevorzugte Website online, während die Knoten am anderen Standort getrennt werden.
Verbesserte Reparaturgeschwindigkeit von Direkte Speicherplätze. Direkte Speicherplätze bieten automatische erneute Synchronisierungsereignisse, die sich auf die Verfügbarkeit von Datenträgern innerhalb des Speicherpools auswirken, z. B. das Herunterfahren eines der Clusterknoten oder ein lokalisierter Hardwarefehler. Azure Local implementiert einen erweiterten Resync-Prozess, der mit einer viel genaueren Granularität als Windows Server 2019 arbeitet. Dieser Prozess reduziert die Dauer des erneuten Synchronisierungsvorgangs erheblich und minimiert die potenziellen Auswirkungen mehrerer, überlappender Hardwarefehler.
Resilienzgrenzwerte. Azure Local bietet mehrere Ebenen der Resilienz, aber aufgrund seiner hyperkonvergenten Architektur unterliegt diese Resilienz Beschränkungen, die nicht nur durch das Cluster quorum, sondern auch durch das Pool quorum.
Integration in eine Reihe von Azure-Diensten, die zusätzliche Resilienzvorteile bieten. Sie können virtualisierte Workloads, die auf lokalen Azure-Instanzen ausgeführt werden, mit solchen Azure-Diensten wie Azure Backup und Azure Site Recovery-integrieren.
Beschleunigtes Failover. Sie können die Netzwerkinfrastruktur und ihre Konfiguration optimieren, um den Abschluss eines Failovers auf Standortebene zu beschleunigen. Sie können z. B. gestreckte virtuelle LANs (VLANs), Netzwerkstraktionsgeräte und kürzere Time to Live (TTL)-Werte in DNS-Einträgen nutzen, die gruppierte Ressourcen darstellen. Darüber hinaus sollten Sie die Standardresilienzperiodeverringern, wodurch der Zeitraum bestimmt wird, in dem eine gruppierte VM im isolierten Zustand ausgeführt werden darf.
Vorsicht
Die Verwendung von Stretched Clusters mit SDN gilt als erweiterte Konfiguration, und Sie sollten sich an Ihren Systemintegrator oder Den Microsoft-Support wenden, um weitere Unterstützung zu erhalten.
Sicherheit
Die Sicherheit bietet Sicherheitsmaßnahmen gegen bewusste Angriffe und den Missbrauch Ihrer wertvollen Daten und Systeme. Weitere Informationen finden Sie unter Prüfliste zur Entwurfsüberprüfung für sicherheitsrelevante.
Schutz während der Übertragung. Speicherreplikat bietet integrierte Sicherheit für seinen Replikationsdatenverkehr, einschließlich Paketsignierung, AES-128-GCM vollständiger Datenverschlüsselung, Unterstützung für Intel AES-NI Verschlüsselungsbeschleunigung und Vorabauthentifizierungsintegritäts-Man-in-the-Middle-Angriffsprävention. Speicherreplikat verwendet auch Kerberos AES256 für die Authentifizierung zwischen den replizierenden Knoten.
Verschlüsselung im Ruhezustand. Azure Local unterstützt die BitLocker-Laufwerkverschlüsselung für seine Datenvolumes, wodurch die Einhaltung von Standards wie FIPS 140-2 und HIPAA erleichtert wird.
Integration in eine Reihe von Azure-Diensten, die zusätzliche Sicherheitsvorteile bieten. Sie können virtualisierte Workloads, die auf lokalen Azure-Instanzen ausgeführt werden, in solche Azure-Dienste wie Microsoft Defender für Cloud integrieren.
Firewallfreundliche Konfiguration. Speicherreplikatdatenverkehr erfordert eine begrenzte Anzahl offener Ports zwischen den replizierten Knoten.
Vorsicht
Speicherreplikate und azure Local Stretched Clusters müssen innerhalb einer AD DS-Umgebung ausgeführt werden. Stellen Sie bei der Planung der Bereitstellung von lokalen gestreckten Clustern die Konnektivität mit AD DS-Domänencontrollern in jedem Standorthostingclusterknoten sicher.
Kostenoptimierung
Bei der Kostenoptimierung geht es um Möglichkeiten, unnötige Ausgaben zu reduzieren und die betriebliche Effizienz zu verbessern. Weitere Informationen finden Sie unter Prüfliste für die Überprüfung der Kostenoptimierung.
Aktiv-aktiv im Vergleich zur aktiven passiven Konfiguration. Gestreckte lokale Azure-Instanzen unterstützen die aktiv-passiven und aktiven Modi. Im aktiven passiven Modus wird ein festgelegter primärer Standort unidirektional auf einen anderen Standort repliziert, der die Notfallwiederherstellungsfunktion bereitstellt. Im aktiven Modus replizieren zwei Standorte ihre jeweiligen Volumes unidirektional miteinander, wodurch Failoverfunktionen bei einem Ausfall an beiden Standorten bereitgestellt werden. Der aktive Modus trägt dazu bei, die Kosten für die Geschäftskontinuität zu minimieren, indem die Notwendigkeit eines dedizierten Notfallwiederherstellungsstandorts vermieden wird.
Cloudzeugen im Vergleich zum Dateifreigabezeugen. Eine Zeugenressource ist eine obligatorische Komponente innerhalb von lokalen Azure-Instanzen. Wählen Sie zum Implementieren entweder einen Azure-Cloudzeugen oder einen Dateifreigabezeugen aus. Ein Azure-Cloudzeuge basiert auf einem Blob in einem Azure-Speicherkonto, das Sie als Vermittlungspunkt festlegen, um Split-Brain-Szenarien zu verhindern. Ein Dateifreigabezeuge basiert auf einer SMB-Dateifreigabe (Server Message Block), um dasselbe Ziel zu erreichen.
Anmerkung
Azure Cloud Witness ist die empfohlene Wahl für lokale gestreckte Azure-Cluster, vorausgesetzt, alle Serverknoten im Cluster verfügen über zuverlässige Internetverbindungen. Die entsprechenden Azure-Gebühren sind vernachlässigbar; sie basieren auf dem Preis eines kleinen Blobs mit seltenen Aktualisierungen, die Änderungen am Clusterstatus entsprechen. In Szenarien mit gestreckten Clustern sollte sich ein Dateifreigabezeuge an einem dritten Standort befinden, wodurch die Implementierungskosten erheblich erhöht werden können, es sei denn, der dritte Standort ist bereits verfügbar und verfügt über zuverlässige Verbindungen zu den Websites, die die gestreckten Clusterknoten hosten.
- Datendeduplizierung. Azure Local and Storage Replica unterstützen die Datendeduplizierung. Ab Windows Server 2019 ist die Deduplizierung auf Volumes verfügbar, die mit Resilient File System (ReFS) formatiert sind. Dies ist das empfohlene Dateisystem für Azure Local. Die Deduplizierung trägt dazu bei, die verwendbare Speicherkapazität zu erhöhen, indem doppelte Teile von Dateien identifiziert und nur einmal gespeichert werden.
Vorsicht
Obwohl Sie den Datendeduplizierungsserverrollendienst sowohl auf den Quell- als auch auf den Zielservern installieren sollten, aktivieren Sie die Datendeduplizierung nicht auf den Zielknoten in einem azure local stretched cluster. Da die Datendeduplizierung Schreibvorgänge verwaltet, sollte sie nur auf Quellclusterknoten ausgeführt werden. Zielknoten empfangen immer deduplizierte Kopien jedes Volumes.
Operative Exzellenz
Operational Excellence deckt die Betriebsprozesse ab, mit denen eine Anwendung bereitgestellt und in der Produktion ausgeführt wird. Weitere Informationen finden Sie unter Prüfliste für die Überprüfung von Operational Excellence.
Automatisches Failover und Wiederherstellung. Ein Primärstandortfehler löst automatisches Failover aus. Nach dem Failover wird auch der Prozess der Replikation vom neuen primären/ehemaligen sekundären Standort zurück zum neuen sekundären/ehemaligen primären Standort automatisch ausgeführt. Um potenzielle Datenverluste zu verhindern, verhindert der Cluster einen Failback, bis die replizierten Volumes vollständig synchronisiert wurden.
Vereinfachte Bereitstellungs- und Verwaltungserfahrung mithilfe von Windows Admin Center. Der Assistent zum Erstellen von Clustern in Windows Admin Center bietet eine assistentengesteuerte Schnittstelle, die Sie durch den Prozess der Erstellung eines azure Local Stretched Clusterführt. Der Assistent erkennt, ob sich Clusterknoten in zwei unterschiedlichen Active Directory Domain Services (AD DS)-Standorten befinden oder ob ihre IP-Adressen zu zwei verschiedenen Subnetzen gehören. Wenn sie sich in zwei verschiedenen Subnetzen befinden, erstellt und konfiguriert der Assistent automatisch die entsprechenden Clusterstandorte mit jeder, die eine separate Fehlerdomäne darstellt. Außerdem können Sie die bevorzugte Website festlegen. Ebenso vereinfacht Windows Admin Center den Prozess der Bereitstellung replizierter Volumes.
Anmerkung
Das Erstellen von Volumes und virtuellen Datenträgern für gestreckte Cluster ist mehr beteiligt als für Cluster mit einem Standort. Gestreckte Cluster erfordern mindestens vier Volumes, bestehend aus zwei Datenvolumes und zwei Protokollvolumes, mit einem Daten-/Protokollvolumepaar an jedem Standort. Wenn Sie ein repliziertes Datenvolume mithilfe von Windows Admin Center erstellen, stellt der Prozess automatisch das Protokollvolume am primären Standort und sowohl Daten als auch replizierte Protokollvolumes am sekundären Standort bereit, um sicherzustellen, dass jeder dieser Volumes über die erforderlichen Größen- und Konfigurationseinstellungen verfügt.
Unterstützung für automatisierte gestreckte Clusterbereitstellung und Speicherverwaltung mithilfe von Windows PowerShell. Sie können PowerShell lokal von einem der lokalen Azure-Computer oder von einem Verwaltungscomputer aus ausführen.
Integration in eine Reihe von Azure-Diensten, die zusätzliche betriebliche Vorteile bieten. Sie können virtualisierte Workloads, die auf lokalen Azure-Instanzen ausgeführt werden, in solche Azure-Dienste wie Azure Monitor- und Azure Automation-Lösungen integrieren, einschließlich Änderungsverfolgungs- und Bestandsüberwachungs- und Updateverwaltung. Nach einem anfänglichen obligatorischen Registrierungsverfahren können Azure Local Instances Azure Arc für die Überwachung und Abrechnung nutzen. Die Azure Arc-Integration bietet eine verbesserte Integration in andere Hybriddienste, z. B. Azure Policy und Log Analytics-. Die Registrierung löst die Erstellung einer Azure Resource Manager-Ressource aus, die eine lokale Azure-Instanz darstellt, wodurch die Azure-Verwaltungsebene effektiv auf Azure Local erweitert wird.
Leistungseffizienz
Die Leistungseffizienz ist die Fähigkeit Ihrer Arbeitsauslastung, die anforderungen, die die Benutzer auf effiziente Weise an sie stellen, zu erfüllen. Weitere Informationen finden Sie unter Prüfliste zur Entwurfsüberprüfung für die Leistungseffizienz.
- Optimierter Replikationsdatenverkehr. Berücksichtigen Sie beim Entwerfen der Infrastruktur für lokale gestreckte Cluster zusätzliche Speicherreplikate, Livemigration und Speicherreplikat-Clusterleistungsverlauf, der zwischen den Standorten fließt. Die synchrone Replikation erfordert mindestens 1 GB Remote-Direct Memory Access (RDMA) oder Ethernet/TCP-Verbindung zwischen gestreckten Clusterstandorten. Je nach Replikationsvolumen benötigen Sie jedoch möglicherweise eine schnellere RDMA-Verbindung. Sie sollten auch mehrere Verbindungen zwischen Standorten bereitstellen, die Resilienzvorteile bieten und es Ihnen ermöglicht, den Speicherreplikatdatenverkehr von Hyper-V Livemigrationsdatenverkehrzu
.
Vorsicht
RDMA ist standardmäßig für den gesamten Datenverkehr zwischen Clusterknoten am selben Standort im selben Subnetz aktiviert. RDMA ist deaktiviert und wird nicht zwischen Standorten oder zwischen verschiedenen Subnetzen unterstützt. Sie sollten SMB Direct entweder für standortübergreifenden Datenverkehr deaktivieren oder zusätzliche Bestimmungen implementieren,, die sie vom knotenübergreifenden Datenverkehr innerhalb desselben Standorts trennen.
Unterstützung für die initiale Initialsynchronisierung. Sie können seeded initial sync in Szenarien implementieren, in denen die anfängliche Synchronisierungszeit minimiert werden muss oder wo eine begrenzte Bandbreite zwischen den beiden Standorten verfügbar ist, die den gestreckten Cluster hosten.
Optimierte Verarbeitung der Speicher-E/A. Stellen Sie sicher, dass optimale Konfiguration replizierter Daten und Protokollvolumes, einschließlich der Leistungsebene, der Volume- und Sektorgröße, des Datenträgertyps und des Dateisystems.
Anmerkung
Windows Admin Center weist automatisch die optimale Konfiguration zu, wenn Sie sie für Bereitstellung gestreckter Clustervolumesverwenden.
Nächste Schritte
- Übersicht über Azure Local Solution
- Failoverclustering in Windows Server und azure Local
- Bereitstellen eines Cloudzeugen für einen Failovercluster-
- Neuerungen in Azure Local
- azure Local FAQ
Verwandte Ressourcen
- Design der Hybridarchitektur
- Azure-Hybridoptionen
- Verwenden von Azure Local switchless interconnect und lightweight quorum für Remotebüros oder Zweigstellen
- Optimieren der Verwaltung von SQL Server-Instanzen in lokalen und multicloud-Umgebungen mithilfe von Azure Arc
- Azure Automation State Configuration