Erstellen resilienter Anwendungsdienste

Abgeschlossen

Ihre Organisation fordert von Ihnen, dass Sie Anforderungen in Bezug auf die Wiederherstellung erfüllen und gleichzeitig Kosten und Komplexität so niedrig wie möglich halten.

In dieser Lerneinheit erfahren Sie, wie Georedundanz und Verfügbarkeitscluster Sie dabei unterstützen, Ihre Anwendung resilienz zu gestalten. Sie erfahren, wie Failovers und Failbacks Ihrer Anwendungen ablaufen. Am Ende dieser Lerneinheit wissen Sie, warum und wie Sie eine Überwachungs- und Benachrichtigungsstrategie implementieren sollten.

Hinzufügen von Georedundanz für Ihre Anwendungen

Sie müssen dafür sorgen, dass Ihre Anwendungen jederzeit ausgeführt werden, unabhängig davon, was in der Infrastruktur passiert, in der sie gehostet werden. Naturkatastrophen und andere Probleme können dazu führen, dass ein ganzer geografischer Bereich keine Stromversorgung oder keinen Internetzugriff hat. Um bei solchen Problemen angemessen zu reagieren und die Betriebsbereitschaft Ihrer Anwendungen sicherzustellen, sollten Sie Georedundanz einrichten. Georedundanz kann jedoch kostspielig sein, wenn sie nicht richtig gemacht wird.

Sie können Azure verwenden, um lokale Anwendungen georedundant zu machen. Eine redundante Infrastruktur für Ihre Anwendungen in Azure bietet den Vorteil, dass Sie keinen physischen Speicherort unterhalten und schützen müssen (und die entsprechenden Kosten nicht anfallen).

In Azure können Sie ohne Verwaltungsaufwand für Redundanz Ihrer Anwendungen sorgen: mit Regionen, die sich auf der anderen Seite der Erde befinden können. Wenn Sie sich nicht um die Verwaltung kümmern müssen, können Sie Georedundanz einfacher und kosteneffektiver erreichen.

Über eine Site-to-Site-VPN-Verbindung können Sie das lokale Netzwerk auf ein virtuelles Netzwerk erweitern, das ein Replikat Ihrer Infrastruktur in einer anderen Region in Azure bildet. Azure Traffic Manager kann Sie bei der Überwachung der Integrität Ihres lokalen Netzwerks unterstützen. Wenn im lokalen Standort ein Problem auftritt, können Sie zur Replikatinfrastruktur in Azure wechseln, die sich in einer anderen Region befindet.

Genauso können Sie Georedundanz für Ihre Anwendungen einrichten, die in Azure ausgeführt werden. Wenn Ihre Anwendungen beispielsweise in einer Gruppe von virtuellen Azure-Computern in einem virtuellen Netzwerk ausgeführt werden, können Sie diese Konfiguration in eine andere Region replizieren und so für Georedundanz sorgen.

Durch Peering virtueller Netzwerke werden zwei getrennte virtuelle Netzwerke verbunden und als ein Netzwerk behandelt. Der Datenverkehr für diese beiden Netzwerke durchläuft weder das öffentliche Internet noch ein Gateway. Ressourcen können direkt Verbindungen mit anderen Ressourcen herstellen, so als befänden sie sich im selben Netzwerk.

In diesem Fall beobachtet Traffic Manager automatisch beide Regionen, um die Integrität der einzelnen Endpunkte zu überwachen. Wenn in Ihrer primären Region ein Problem auftritt, leitet Traffic Manager die Anforderungen an Ihre sekundäre Region weiter.

Hinzufügen von Hochverfügbarkeitsclustern

Hochverfügbarkeitscluster tragen dazu bei, dass Ihre Workloads mit nur minimalen Ausfallzeiten verfügbar bleiben und ausgeführt werden. Sie können Hochverfügbarkeitscluster in jedem der folgenden Architekturtypen verwenden:

  • Aktiv/Aktiv-Architektur: Sie verteilen die Anforderungen auf mehrere Knoten, z. B. zwei identische Azure-VMs, und richten einen Lastenausgleich ein. Sie können den Bedarf von diesen virtuellen Azure-Computern gleichzeitig gemeinsam verarbeiten lassen. Sie können den Bedarf auch abhängig von verschiedenen Routingmethoden verteilen.

    Die folgende Abbildung zeigt ein allgemeines Beispiel eines Aktiv/Aktiv-Clusters.

    Diagramm: Aktiv/Aktiv-Beispiel

  • Aktive/Passiv-Architektur: Bei der Ausführung von Azure-VMs ist ein Knoten aktiv und wird verwendet, der andere Knoten ist passiv und wird nicht verwendet. Der passive Knoten wird nur verwendet, wenn der aktive Knoten ausfällt.

In einem Aktiv/Aktiv-Szenario werden alle Knoten gleichzeitig ausgeführt. In diesem Szenario fallen im Vergleich zu einem Aktiv/Passiv-Cluster höhere Kosten für die Ausführung an, wenn die Computer in beiden Szenarien dieselben Spezifikationen aufweisen.

Aktiv/Passiv-Cluster können kostengünstiger sein als Aktiv/Aktiv-Cluster. Da der passive Knoten nicht aktiv an der Verarbeitung von Benutzeranforderungen beteiligt ist, können die Kosten für Softwarelizenzierung und Ressourcen niedriger sein. Da in einem Aktiv/Passiv-Cluster jedoch nur der aktive Knoten ausgeführt wird, können Sie nicht so flexibel auf schwankende Nachfrage reagieren wie bei einem Aktiv/Aktiv-Cluster.

Ressourcen wie Azure-Verfügbarkeitsgruppen erleichtern das Erreichen einer hohen Verfügbarkeit durch mehrere Knoten. Wenn ein Computer beeinträchtigt wird, z. B. durch Hardwarefehler oder Netzwerkausfälle, kann ein anderer Computer dessen Aufgaben übernehmen.

Sie können auch Azure-VM-Skalierungsgruppen verwenden, um einen Aktiv/Aktiv-Cluster zu erstellen und Computer auszuführen, die unmittelbar bedarfsabhängig entsprechend skaliert werden. Azure Load Balancer kann Sie mithilfe der Regeln für Hochverfügbarkeitsports ebenfalls bei der Verwendung von Aktiv/Aktiv- oder Aktiv/Passiv-Clustern für Ihre Computer unterstützen.

Failover und Failback von Anwendungen

Ihre Organisation verfügt über eine Infrastruktur für ihre Anwendungen, die lokal ausgeführt werden. Sie müssen sicherstellen, dass Ihre Organisation Complianceanforderungen erfüllt und Ziele im Hinblick auf die Geschäftskontinuität erreicht. Durch die gemeinsame Verwendung von Azure Site Recovery und Traffic Manager können Sie ein Failover zu Azure und dann ein Failback durchführen, damit die Anwendungen unterbrechungsfrei ausgeführt werden.

Wenn ein Fehler auftritt, können Sie den Clientdatenverkehr ohne Unterbrechung an eine für Sie in Azure erstellte Infrastruktur umleiten. Verwenden Sie Traffic Manager, um ein Profil zu erstellen und eine bevorzugte Routingmethode festzulegen. Erstellen Sie danach zwei Endpunkte: einen für die lokale Umgebung und einen für die Umgebung, die Sie in Azure einrichten möchten.

Da Sie normalerweise eine lokale Umgebung betreiben, aber eine zweite Umgebung in Azure haben möchten, um ein Failover ausführen zu können, können Sie die folgenden zwei Prioritäten festlegen:

  • Priorität 1 für die lokale Umgebung
  • Priorität 2 für Ihre Umgebung in Azure

Diese Prioritäten teilen Traffic Manager mit, wie der Datenverkehr zwischen den beiden Umgebungen weitergeleitet werden soll. Traffic Manager leitet den Datenverkehr an die lokale Umgebung weiter, bis er bemerkt, dass der Endpunkt nicht mehr funktionsfähig ist. In diesem Fall leitet Traffic Manager den Datenverkehr an die zweite Umgebung in Azure weiter.

Azure Site Recovery beginnt nur dann mit der Ausführung der virtuellen Computer in Azure, wenn ein Failover ausgelöst wird. Wenn ein Notfall auftritt, können Sie Azure Site Recovery verwenden, um ein Failover der lokalen Umgebung in die Azure-Umgebung zu starten.

Traffic Manager bietet die Möglichkeit, die Überprüfungshäufigkeit für die Überwachung der Endpunkte festzulegen. Sie konfigurieren Traffic Manager so, dass die Integrität der Endpunkte bei regulären Überprüfungen alle 30 Sekunden und bei schnelleren Überprüfungen alle 10 Sekunden überwacht wird.

Nach Abschluss eines Failovers werden die Clients transparent an den neuen Endpunkt in Azure umgeleitet. Wenn das Problem behoben wurde, durch das das Failover ausgelöst wurde, können Sie mithilfe von Azure Site Recovery wieder ein Failback zur lokalen Umgebung ausführen. Traffic Manager überprüft weiterhin den Zustand Ihres lokalen Endpunkts. Wenn Traffic Manager feststellt, dass der Endpunkt wieder fehlerfrei ist, wird der Datenverkehr wieder zurück an die lokale Umgebung geleitet.

Diagramm: hybrides Netzwerk

Überprüfen Sie Ihr Wissen

1.

Wie im vorherigen Diagramm dargestellt, betreiben Sie Ihre Infrastruktur teilweise in der Cloud und teilweise lokal. Wie aktivieren Sie die Datenverkehrsumleitung in Echtzeit, wenn die Stromversorgung unterbrochen wird?

2.

Ihr Unternehmen beginnt seine Tätigkeit in einer neuen Region. Wie können Sie Leistungsprobleme in der neuen Region verhindern?

3.

Welche der folgenden Ressourcen können aus Sicherungen wiederhergestellt werden?