Zuverlässigkeit in Microsoft Community Training
Microsoft Community Training ist eine cloudbasierte Azure-Lösung, die die Durchführung umfangreicher, weit verbreiteter Trainingsprogramme mit hoher Qualität und Effizienz ermöglicht. Mithilfe von Community Training können Organisationen aller Größen und Arten umfangreiche Trainingsprogramme für ihre internen und externen Communitys durchführen. Communitys können Mitarbeiter:innen mit Kundenkontakt, erweiterte Belegschaften, ein Partnerökosystem, ein Freiwilligennetzwerk und Programmempfänger:innen umfassen.
In diesem Artikel wird die Zuverlässigkeitsunterstützung in Community beschrieben, wobei sowohl regionsinterne Resilienz mittels Verfügbarkeitszonen als auch Notfallwiederherstellung und Geschäftskontinuität behandelt werden. Eine ausführlichere Übersicht über ein Prinzip der Zuverlässigkeit in Azure finden Sie unter Azure-Zuverlässigkeit.
Unterstützung für Verfügbarkeitszonen
Verfügbarkeitszonen sind physisch getrennte Gruppen von Rechenzentren innerhalb einer Azure-Region. Wenn eine Zone ausfällt, erfolgt ein Failover der Dienste zu einer der verbleibenden Zonen.
Weitere Informationen zu Verfügbarkeitszonen in Azure finden Sie unter Was sind Verfügbarkeitszonen?.
Community Training verwendet Azure-Verfügbarkeitszonen, um Hochverfügbarkeit und Fehlertoleranz innerhalb einer Azure-Region zu gewährleisten. Community Training bietet Unterstützung für Verfügbarkeitszonen auf Steuer- und Datenebene:
Die Steuerebene ist in den primären Verfügbarkeitsregionen zonenredundant.
Die Datenebene kann entweder zonenspezifisch oder zonenredundant sein, je nachdem, welches Konzept Sie für Ihre Anforderungen auswählen. Es wird jedoch dringend empfohlen, eine zonenredundante Bereitstellung auszuwählen, um während eines Zonenausfalls Datenverluste zu vermeiden und die Dienstverfügbarkeit aufrechtzuerhalten.
Voraussetzungen
Verfügbarkeitszonen werden für die folgenden Community Training-SKUs unterstützt:
- Standard (weniger Benutzer:innen)
- Premium (mehr Benutzer:innen)
Community Training wird nur in Regionspaaren unterstützt. Jede sekundäre Region wird mit einer Zonenkonfiguration bereitgestellt. In der folgenden Tabelle sind alle Regionen aufgeführt, die Verfügbarkeitszonen für Community Training unterstützen, zusammen mit der jeweiligen gepaarten Region.
Primäre Region | Gepaarte Region |
---|---|
UKSouth | UK, Westen |
AustralienOsten | Australien,Südosten |
EastUS | USA, Westen |
EastUS2 | USA, Mitte |
Europa, Norden | Europa, Westen |
WestUS3 | EastUS |
SwedenCentral | SwedenSouth |
Unterstützung für zonales Failover
Community Training verwendet viele Azure-Abhängigkeitsdienste, z. B. App-Dienst und Azure SQL. Wenn Sie eine zonenredundante Bereitstellung auswählen, erstellt Community Training auch zonenredundante Angebote dieser zugrunde liegenden Azure-Dienstressourcen. Wenn eine Zone fehlschlägt, wird für alle Ressourcen, einschließlich der Abhängigkeitsressourcen, ein Failover zu einer der fehlerfreien Zonen ausgeführt.
Erstellen einer Ressource mit aktivierter Verfügbarkeitszone
Community Training ermöglicht die Konfiguration für Verfügbarkeitszonen nur zum Zeitpunkt der Instanzerstellung. Wenn Sie die Konfiguration Ihrer Verfügbarkeitszonen nach der Instanzerstellung ändern möchten, müssen Sie eine neue Instanz erstellen. Informationen zum Erstellen Ihrer Community Training-Instanz finden Sie unter Erstellen von Community Training.
Zonenausfall
Zonal. Während eines zonenweiten Ausfalls kann in Community Training entweder eine vollständige oder eine partielle Dienstunterbrechung auftreten. Der Verfügbarkeitsumfang hängt von verschiedenen Faktoren ab, z. B. davon, ob das gesamte Rechenzentrum ausgefallen ist oder ob ein bestimmter Abhängigkeitsdienst in dieser Zone nicht mehr verfügbar ist.
Zonenredundant. Während eines zonenweiten Ausfalls sollten keine Auswirkungen auf bereitgestellte Ressourcen auftreten. Sie sollten jedoch auf eine kurze Unterbrechung der Kommunikation mit diesen Ressourcen vorbereitet sein. Wenn eine Zone ausgefallen ist, erhalten Clients meist 409-Fehlercodes, und die Wiederholungslogik versucht in entsprechenden Intervallen, die Verbindungen wiederherzustellen. Neue Anforderungen werden auf fehlerfreie Knoten geleitet, die keine Auswirkungen auf den Benutzer haben. Während zonenweiter Ausfälle können Benutzer neue Ressourcen erstellen und vorhandene erfolgreich skalieren.
Notfallwiederherstellung und Geschäftskontinuität
Bei der Notfallwiederherstellung (DR) geht es um die Wiederherstellung nach Ereignissen mit schwerwiegenden Auswirkungen, z. B. Naturkatastrophen oder fehlerhaften Bereitstellungen, die zu Downtime und Datenverlust führen. Unabhängig von der Ursache ist das beste Mittel gegen einen Notfall ein gut definierter und getesteter Notfallplan und ein Anwendungsdesign, die Notfallwiederherstellung aktiv unterstützt. Bevor Sie mit der Erstellung Ihres Notfallwiederherstellungsplans beginnen, lesen Sie die Empfehlungen zum Entwerfen einer Notfallwiederherstellungsstrategie.
Bei DR verwendet Microsoft das Modell der gemeinsamen Verantwortung. In einem Modell der gemeinsamen Verantwortung stellt Microsoft sicher, dass die grundlegenden Infrastruktur- und Plattformdienste verfügbar sind. Gleichzeitig replizieren viele Azure-Dienste nicht automatisch Daten oder greifen automatisch auf eine ausgefallene Region zurück, um eine regionsübergreifende Replikation in eine andere aktivierte Region durchzuführen. Für diese Dienste sind Sie dafür verantwortlich, einen Notfallwiederherstellungsplan zu erstellen, der für Ihre Workload geeignet ist. Die meisten Dienste, die auf Azure Platform as a Service (PaaS)-Angeboten laufen, bieten Funktionen und Anleitungen zur Unterstützung von Notfallwiederherstellung und Sie können dienstspezifische Funktionen zur Unterstützung einer schnellen Wiederherstellung nutzen, um Ihren Notfallwiederherstellungsplan zu entwickeln.
Das Microsoft Community Training-Team verwaltet das gesamte Notfallwiederherstellungsverfahren für Community Training. Die Notfallwiederherstellung ist weder „aktiv-aktiv“ noch „aktiv-passiv“, sondern sie basiert auf der Wiederherstellung aus der neuesten verfügbaren Sicherung von Azure-Diensten. Das Community Training-Team erstellt manuell alle Ressourcen in der gepaarten Region aus der Datensicherung.
Hinweis
Die Notfallwiederherstellung in Community Training wird nur in Regionspaaren unterstützt.
Notfallwiederherstellung für mehrere Regionen
Bei einem regionalen Notfall wird für die Steuerebene manuell ein Failover an die gepaarte Region durchgeführt. Bevor das Failover abgeschlossen ist, kann es zu einer Beeinträchtigung des Dienstes kommen. Nach dem Failover werden nur schreibgeschützte Vorgänge unterstützt, bis die Notfallregion wieder online ist. Für den Dienst wird manuell ein Failback in die ursprüngliche Region vorgenommen, sobald sie wieder online ist, und alle Vorgänge werden fortgesetzt. Das Recovery Point Objective (RPO) beträgt schätzungsweise 10 Minuten, das Recovery Time Objective (RTO) 24 Stunden.
Für die Datenebene bietet Community Training eine von Microsoft verwaltete Notfallwiederherstellung. Um die verwaltete Notfallwiederherstellung zu verwenden, aktivieren Sie die Notfallwiederherstellung während der Erstellung von Community Training-Instanzen in Azure. Nachdem Sie die Notfallwiederherstellung aktiviert haben, übernimmt Microsoft die Sicherung des Speichers und der Datenbank in der gepaarten Region. Das Recovery Point Objective (RPO) beträgt schätzungsweise 12 Stunden, das Recovery Time Objective (RTO) 48 Stunden.
Hinweis
RTO hängt von der Größe der Datenbank und des Speichers sowie von der Wartezeit zwischen den gepaarten Regionen ab. Datenbank- oder Speicher-VM-Kapazität (SKU). RPO hängt von zugrunde liegenden Azure-Ressourcen ab, z. B. Azure SQL und Azure-Speicher. Weitere Informationen zu RTO und RPO finden Sie unter Übersicht über die Notfallwiederherstellung.
Erkennung, Benachrichtigung und Verwaltung von Ausfällen
Wenn eine Integritätsprüfung für Community Training einen Ausfall eines beliebigen Dienstes in einer beliebigen Region erkennt, fordert Microsoft Ihre Einwilligung zum Failover in die gepaarte Region an. Microsoft informiert Sie, welche Funktionen während des Notfallwiederherstellungsvorgangs verfügbar sind. Sobald Microsoft Ihre Einwilligung erhält, kann das Community Training-Team das Notfallwiederherstellungsverfahren starten.
Wichtig
Lernende können Audio-/Videofunktionen erst wieder nutzen, wenn die primäre Region betriebsbereit ist. Sie sollten Medienuploadvorgänge vermeiden, bis der primäre Standort betriebsbereit ist.
Kapazität und proaktive Resilienz der Notfallwiederherstellung
Microsoft und seine Kunden arbeiten im Rahmen des Modells der gemeinsamen Verantwortung. Sobald eine Region ausfällt, wird nicht nur die Community Training-Instanz in die gepaarte Region migriert, sondern auch alle Workloads für Produkte und Kund:innen werden migriert. Dies kann zu einem Mangel an Ressourcen in der gepaarten Region oder im Rechenzentrum führen. Daher hängt die Verfügbarkeit der Notfallwiederherstellung von der verfügbaren Kapazität der zugrunde liegenden Azure-Ressourcen ab.