Freigeben über


Optimieren von Geschäftskontinuität und Notfallwiederherstellung

Wenn Sie Oracle-Ressourcen zu Azure migrieren, sollten Sie die Zuverlässigkeit Ihrer Datenbank und auch die Zuverlässigkeit der Ebenen auf virtuellen Computern (VMs), virtuellen Netzwerksubnetzen und Speicherkomponenten berücksichtigen.

Oracle auf Azure-Infrastruktur as a Service (IaaS) kann die erforderlichen Resilienzziele der anspruchsvollsten Oracle-Workloads erfüllen. Um die Anleitungen in diesem Artikel effektiv zu verwenden, definieren Sie zunächst Ihre KpIs (Resiliency Key Performance Indicators) basierend auf Ihren Geschäftlichen Anforderungen. Verwenden Sie Ihre RTO-Anforderungen (Recovery Time Objective) und Wiederherstellungspunktziel (Recovery Point Objective, RPO) als Basis-KPIs, um die beste Architektur für Ihre Oracle-Workload in Azure zu ermitteln.

Das RTO ist die maximale Zeitspanne, die eine Anwendung nach einem Notfall, Einem Fehler oder einem vergleichbaren Ereignis nicht verfügbar bleibt.

Das RPO ist die maximale Menge an Datenverlusten nach einem Notfall, einem Fehler oder einem vergleichbaren Ereignis.

Sicherungsmethoden zum Datenschutz

Zu den drei Oracle-Datenbanksicherungsmethoden für eine Oracle-Workload auf Azure IaaS gehören:

  • Streamingsicherungen. Verwenden Sie Oracle Recovery Manager (RMAN) für diese Methode. RMAN streamt Sicherungen auf sequenzielle Bandmedien.

    Zu den Sicherungszielen in Azure gehören:

    • Nicht von Microsoft stammende virtuelle Bandbibliotheken, die Sie in Azure Marketplace finden können.
    • Lokale und Remotedateifreigaben, z. B. Azure Blob Storage mit dem Netzwerkdateisystemprotokoll, Azure Files und Azure NetApp Files.
  • Momentaufnahmen auf Speicherebene. Verwenden Sie Azure Backup für diese Methode. Diese Methode basiert auf dem Speichertyp, den Sie für Datenbankdateien verwenden. Wenn Sie z. B. azure managed disks verwenden, z. B. Azure Premium SSD, wird Azure Backup in die Oracle-Datenbank integriert. Wenn Sie Azure NetApp Files verwenden, können Sie Azure NetApp Files-Datenschutzfunktionen wie Azure NetApp Files-Sicherung und regionsübergreifende Replikation verwenden.

  • Sicherungen auf VM-Ebene. Verwenden Sie Azure Backup für diese Methode.

    Achtung

    Stellen Sie sicher, dass die virtuellen Computer in Ihrer Sicherungsumgebung OSs ausführen, die unterstützungssicher sind. Erfahren Sie mehr über die unterstützten OSs.

Wenn Sie Sicherungen großer Datenbanken streamen, kann die Zeit, die zum Kopieren der Daten benötigt wird, wiederherstellen, die RTO-Anforderungen überschreiten. Momentaufnahmen auf Speicherebene sind die beste Option für dieses Szenario.

Empfehlungen

  • Überlegen Sie sorgfältig, ob Sie eine Sicherungsstrategie implementieren möchten, die auf Streaming, auf Momentaufnahmen auf Speicherebene oder auf beiden Strategien basiert.

  • Bewerten Sie die Auswirkungen Ihrer Sicherungsstrategie auf Ihre RTO- und RPO-Anforderungen.

  • Analysieren Sie die verfügbaren Speicherziele für Ihre RMAN-Sicherungen basierend auf den dokumentierten Durchsatzgrenzwerten für jede Option. Wählen Sie die Option aus, die Ihren Anforderungen entspricht.

  • Erwägen Sie die Verwendung von Azure Backup für Ihre Snapshots auf Speicherebene und platzieren Sie die Snapshots in einer gepaarten Region oder einer Verfügbarkeitszone für zusätzlichen Schutz.

  • Ziehen Sie verschiedene Speicheroptionen in Betracht, um die Archivprotokollsicherungen zu speichern, die Sie zum Wiederherstellen der Datenbank benötigen. Berücksichtigen Sie die Leistungs-, Replikations- und Kostenaspekte jeder Option.

  • Entwickeln und testen Sie regelmäßig Ihre Sicherungs- und Wiederherstellungspläne, um unangenehme Überraschungen in Ihrer Produktionsumgebung zu vermeiden.

Dienstschutz und Geschäftskontinuität

In diesem Abschnitt wird beschrieben, wie Sie die allgemeine Hohe Verfügbarkeit (HA) und die Notfallwiederherstellung (DR) Ihrer Oracle-Workload auf Azure IaaS verbessern, indem Sie Überlegungen zum Dienstschutz und zur Geschäftskontinuität (Business Continuity, BC) implementieren.

Integrieren Sie die folgenden Empfehlungen, um die Architekturredundanz zu verbessern, und maximieren Sie letztendlich die Zeit, die Ihr Dienst zur Verfügung steht. Soll die Dienstausfallzeit aufgrund geplanter Ausfälle wie Patches, Updates und Upgrades sowie ungeplanter Ausfalle wie z. B. Fehler minimiert werden. Verwenden Sie Azure- und Oracle-Funktionen, um Ihre Wiederherstellung von geografieweiten Fehlern zu verbessern.

Azure bietet viele Optionen für die hohe Verfügbarkeit einzelner Komponenten in einer Oracle on IaaS-Architektur. Sie können zum Beispiel Folgendes:

  • Stellen Sie virtuelle Computer mithilfe eines flexiblen Skalierungssatzes für virtuelle Computer bereit, der virtuelle Computer automatisch über Fehlerdomänen verteilt.
  • Erstellen Sie Verfügbarkeitszonen, um vor Rechenzentrumsfehlern zu schützen.
  • Platzieren Sie Bereitstellungen in verschiedenen Regionen, um vor Fehlern in voller Region zu schützen.

Verschiedene Azure-Speicherfunktionen bieten unterschiedliche Speicherredundanzstufen, z. B. lokal redundanter Speicher, zonenredundanter Speicher und georedundanter Speicher. Berücksichtigen Sie jede Option, wenn Sie Ihre Oracle-Workloadbereitstellung auf Azure IaaS planen.

Sie können auch Oracle Data Guard verwenden, bei dem es sich um ein Tool zum Oracle-Datenbankdienstschutz handelt. Data Guard leitet Transaktionsprotokolle weiter und wendet sie auf eine oder mehrere Standbydatenbanken an. Dieser Vorgang verwaltet genaue Kopien der primären Datenbank, zu der Sie fehlschlagen können, wenn Sie ein Wartungs- oder Ausfallszenario geplant haben.

Data Guard verfügt über drei Arten der Datenreplikation: maximaler Schutz, maximale Verfügbarkeit und maximale Leistung. Jeder Replikationsmodus bietet eine andere Kombination aus Protokolltransportmodi und verschiedenen Transaktionsgarantien für die Anwendung in der sekundären Datenbank.

Abhängig von Ihrer Strategie, z. B. einer Nulllatenz- oder einer Null-Datenverluststrategie, können Sie eine synchrone oder asynchrone Konfiguration auswählen. Sie können auch ein Schnellstartfailover implementieren, je nach ihren maximalen Ausfallzeiten. Referenzarchitekturen sind verfügbar, die eine Wiederherstellung in weniger als einer Minute oder weniger als fünf Minuten und bis zu vier Stunden bereitstellen. Die Enterprise Edition von Oracle Database umfasst Data Guard.

Oracle GoldenGate ist ein weiteres Tool, mit dem Sie Daten zwischen zwei Datenbanken replizieren und mehrere primäre Szenarien aktivieren können. Sie müssen GoldenGate separat erwerben.

Empfehlungen

  • Berücksichtigen Sie die Funktionen, die Azure für die hohe Verfügbarkeit verschiedener Infrastrukturkomponenten in Ihrer Oracle on Azure IaaS-Implementierung bereitstellt.

  • Wählen Sie sorgfältig den Datenbankschutzmodus aus, der Ihre Anforderungen erfüllt, wenn Sie Data Guard für HA und DR verwenden. Beispielsweise minimiert der maximale Leistungsmodus die Auswirkungen auf die Quelle, hat aber das höchste Potenzial für Datenverlust. Weitere Informationen finden Sie unter BCDR für Oracle auf Azure Virtual Machines Landing Zone Accelerator und Oracle Data Guard-Schutzmodi.

  • Ziehen Sie in Erwägung, Ihren Failoverprozess zu automatisieren. Sie können z. B. ein Schnellstartfailover verwenden.

  • Richten Sie Testverfahren für Ihre Failoverprozesse ein, und führen Sie regelmäßige Tests durch, um Probleme zu vermeiden.

  • Gestalten Sie Ihre Lösung ganzheitlich, indem Sie Azure-native Funktionen wie Verfügbarkeitszonen und Oracle-native Tools wie Data Guard verwenden, um Ihre HA- und DR-Anforderungen zu erfüllen. In den folgenden beiden Beispielen werden Azure-native und Oracle-native Komponenten verwendet.

Erstellen eines Failovers mit passivem Standbymodus

In diesem Abschnitt wird ein Beispiel für ein Failoverszenario für geschäftskritische Oracle-Anwendungen in einer Bereitstellung mit zwei Verfügbarkeitszonen mit passivem Standby beschrieben.

Geschäftskritische Oracle-Anwendungen wie Oracle E-Business Suite erfordern Ausfallprävention und daher eine ganzheitliche Architektur.

Dieses Beispiel:

  • Verfügt über eine Bereitstellung mit zwei Verfügbarkeitszonen. Die Anwendungsebene verwendet Azure Site Recovery mit einer passiven sekundären VM.

  • Nutzt die Vorteile des Schnellstartfailoverfeatures von Data Guard. Um die höchste Verfügbarkeit zu erhalten, empfehlen wir, zwei Beobachter zu installieren. Der primäre Beobachter befindet sich in der ersten Verfügbarkeitszone, und der sekundäre Beobachter befindet sich in der Verfügbarkeitszone 2. Die Beobachter überwachen und leiten den Verkehr. Wenn die primäre Datenbank nicht verfügbar ist, schlägt der Beobachter automatisch mit der sekundären Datenbank fehl. Data Guard führt eine Redo-Synchronisierung aus. Der Zeitrahmen der Redo-Synchronisierung hängt von ihrer Redo-Konfiguration ab.

  • Hat Data Guard auf einen Datenschutzmodus konfiguriert, z. B. maximale Verfügbarkeit, maximale Leistung oder maximaler Schutz. Weitere Informationen zum Auswählen eines Modus für Ihre Workloadanforderungen finden Sie unter Oracle Data Guard-Schutzmodi.

Die folgende Architektur zielt auf eine Ausfallzeitschwelle von weniger als fünf Minuten ab.

Diagramm, das die Architektur für ein Failover mit passivem Standbymodus zeigt.

Erstellen eines Failovers mit aktivem Standbymodus

In diesem Abschnitt wird ein Beispiel für ein Failoverszenario für geschäftskritische Oracle-Anwendungen in einer Bereitstellung mit zwei Verfügbarkeitszonen mit aktivem Standby beschrieben.

In diesem Beispiel:

  • Die Webserverebene, Anwendungsebene und Datenbankebene befinden sich in ihrem eigenen virtuellen Netzwerk-Subnetz.

  • Die primäre Datenbank befindet sich in der ersten Verfügbarkeitszone.

  • Die Datenbank, die Active Data Guard verwendet, um die primäre Datenbank in einen aktiven Standbymodus zu replizieren, befindet sich in der dritten Verfügbarkeitszone.

Hinweis

Für dieses Setup ist eine Active Data Guard-Lizenz erforderlich.

Die folgende Architektur zielt auf einen Ausfallzeitschwellenwert von weniger als einer Minute ab. Dieses Failoverszenario verfügt über eine aktive Standbykonfiguration, verfügt jedoch über schreibgeschützte Funktionen.

Diagramm, das die Architektur für ein Failover mit aktivem Standbymodus zeigt.

Nächster Schritt