Von Kunden aktivierte Notfallwiederherstellung
Wichtig
Die in diesem Artikel markierten Elemente (Vorschau) sind aktuell als öffentliche Vorschau verfügbar. Diese Vorschauversion wird ohne Vereinbarung zum Servicelevel bereitgestellt und sollte nicht für Produktionsworkloads verwendet werden. Manche Features werden möglicherweise nicht unterstützt oder sind nur eingeschränkt verwendbar. Weitere Informationen finden Sie unter Zusätzliche Nutzungsbestimmungen für Microsoft Azure-Vorschauen.
Planen Sie voraus, um die Uptime zu maximieren, die Geschäftskontinuität aufrechtzuerhalten und die Notfallwiederherstellung mit Azure KI Studio vorzubereiten. Da Azure KI Studio auf der Azure Machine Learning-Architektur aufbaut, ist es von Vorteil, auf die grundlegende Architektur zu verweisen.
Microsoft möcht sicherstellen, dass Azure-Dienste immer verfügbar sind. Es kann jedoch zu ungeplanten Dienstausfällen kommen. Es wird empfohlen, einen Notfallwiederherstellungsplan für die Behandlung regionaler Dienstausfälle zu erstellen. In diesem Artikel werden folgende Vorgehensweisen behandelt:
- Planen Sie eine sich auf mehrere Regionen erstreckende Bereitstellung von Azure KI Studio und zugehörigen Ressourcen.
- Maximieren Sie die Chancen, Protokolle, Notebooks, Docker-Images und andere Metadaten wiederherzustellen.
- Erstellen Sie einen Entwurf für die Hochverfügbarkeit Ihrer Lösung.
- Initiieren Sie ein Failover in eine andere Region.
Wichtig
Azure KI Studio selbst bietet kein automatisches Failover bzw. keine automatische Notfallwiederherstellung.
Grundlegendes zu Azure-Diensten für Azure KI Studio
Azure KI Studio ist von mehreren Azure-Diensten abhängig. Einige dieser Dienste werden in Ihrem Abonnement bereitgestellt. Sie sind für die Hochverfügbarkeitskonfiguration dieser Dienste verantwortlich. Microsoft verwaltet einige Dienste, die in einem Microsoft-Abonnement erstellt werden.
Die Azure-Dienste umfassen Folgendes:
Azure KI Studio-Infrastruktur: Eine von Microsoft verwaltete Umgebung für den Azure KI Studio-Hub und das Azure KI Studio-Projekt. Die [zugrunde liegende Architektur](Azure KI Studio-Architekturdokument) wird von Azure Machine Learning bereitgestellt.
Erforderliche zugeordnete Ressourcen: Ressourcen, die in Ihrem Abonnement während der Azure KI Studio-Hub- und Projekterstellung bereitgestellt wurden. Zu diesen Ressourcen gehören Azure Storage und Azure Key Vault.
- Standardspeicher enthält Daten wie etwa Modelle, Trainingsprotokolldaten und Verweise auf Datenressourcen.
- Key Vault enthält Anmeldeinformationen für Azure Storage und Verbindungen.
Optional zugeordnete Ressourcen: Ressourcen, die Sie an Ihren Azure KI Studio-Hub anfügen können. Zu diesen Ressourcen gehören Azure Container Registry und Application Insights.
- Container Registry enthält ein Docker-Image für die Trainings- und Rückschlussumgebungen.
- Application Insights dient zum Überwachen von Azure KI Studio.
Compute-Instanz: Ressource, die Sie nach der Hubbereitstellung erstellen. Von Microsoft verwaltete Umgebungen für die Modellentwicklung.
Verbindungen: Azure KI Studio kann eine Verbindung mit verschiedenen anderen Diensten herstellen. Sie sind für das Konfigurieren der Hochverfügbarkeitseinstellungen verantwortlich.
Die folgende Tabelle zeigt die Azure-Dienste, die Microsoft verwaltet, und die von Ihnen verwalteten Dienste. Außerdem werden die Dienste angegeben, die standardmäßig hoch verfügbar sind.
Dienst | Verwaltet von | Hochverfügbarkeit standardmäßig |
---|---|---|
Azure KI Studio-Infrastruktur | Microsoft | |
Zugeordnete Ressourcen | ||
Azure Storage | Sie | |
Key Vault | Sie | ✓ |
Container Registry | Sie | |
Application Insights | Sie | Nicht verfügbar |
Computeressourcen | ||
Compute-Instanz | Microsoft | |
Verbindung mit externen Diensten wie Azure KI Services | Sie |
Im weiteren Verlauf dieses Artikels werden die Aktionen beschrieben, die Sie durchführen müssen, damit die einzelnen Dienste hochverfügbar werden.
Planen der Bereitstellung in mehreren Regionen
Eine Bereitstellung in mehreren Regionen basiert auf der Erstellung von Azure KI Studio-Ressourcen und anderen Ressourcen (Infrastruktur) in zwei Azure-Regionen. Wenn ein regionaler Ausfall auftritt, können Sie zur anderen Region wechseln. Beachten Sie bei der Planung des Bereitstellungsorts für Ihre Ressourcen Folgendes:
Regionale Verfügbarkeit: Verwenden Sie nach Möglichkeit eine Region im selben geografischen Gebiet und nicht unbedingt die Region, die am nächsten ist. Informationen zur regionalen Verfügbarkeit für Azure KI Studio finden Sie unter Azure-Produkte nach Region.
Azure-Regionspaare: Regionspaare koordinieren Plattformupdates und priorisieren bei Bedarf Wiederherstellungsvorgänge. Allerdings unterstützen nicht alle Regionen gekoppelte Regionen. Weitere Informationen finden Sie unter Azure-Regionspaare.
Dienstverfügbarkeit: Entscheiden Sie, ob die von Ihrer Lösung verwendeten Ressourcen Zugriffsebenen der Varianten heiß/heiß, heiß/warm oder heiß/kalt aufweisen sollen.
- Heiß/heiß: Beide Regionen sind gleichzeitig aktiv, und in einer Region kann die Verwendung sofort beginnen.
- Heiß/warm: Die primäre Region ist aktiv, die sekundäre Region verfügt über wichtige Ressourcen (z. B. bereitgestellte Modelle), die startbereit sind. Weniger wichtige Ressourcen müssten manuell in der sekundären Region bereitgestellt werden.
- Heiß/kalt: Die primäre Region ist aktiv, in der sekundären Region sind Azure KI Studio-Ressourcen und andere Ressourcen sowie die erforderlichen Daten bereitgestellt. Ressourcen wie Modelle, Modellimplementierungen oder Pipelines müssten manuell bereitgestellt werden.
Tipp
Abhängig von Ihren Geschäftsanforderungen können Sie verschiedene Azure KI Studio-Ressourcen jeweils unterschiedlich behandeln.
Azure KI Studio baut auf weiteren Diensten auf. Einige Dienste können für die Replikation in andere Regionen konfiguriert werden. Andere müssen Sie manuell in mehreren Regionen erstellen. Die folgende Tabelle enthält eine Liste der Dienste, den jeweiligen Replikationsverantwortlichen sowie eine Übersicht über die jeweilige Konfiguration:
Azure-Dienst | Georeplikation durch | Konfiguration |
---|---|---|
KI Studio-Hub und -Projekte | Sie | Erstellen Sie einen Hub/Projekte in den ausgewählten Regionen. |
KI Studio-Compute-Instanz | Sie | Erstellen Sie die Computeressourcen in den ausgewählten Regionen. Stellen Sie für Computeressourcen, die dynamisch skaliert werden können, sicher, dass beide Regionen ein ausreichendes Computekontingent für Ihre Anforderungen bereitstellen. |
Key Vault | Microsoft | Verwenden Sie dieselbe Key Vault-Instanz mit dem Azure KI Studio-Hub und den Ressourcen in beiden Regionen. Von Key Vault wird ein automatisches Failover in eine sekundäre Region ausgeführt. Weitere Informationen finden Sie unter Azure Key Vault: Verfügbarkeit und Redundanz. |
Speicherkonto | Sie | Azure Machine Learning unterstützt kein Failover des Standardspeicherkontos mit georedundantem Speicher (GRS), geozonenredundantem Speicher (GZRS), georedundantem Speicher mit Lesezugriff (RA-GRS) oder geozonenredundantem Speicher mit Lesezugriff (RA-GZRS). Konfigurieren Sie ein Speicherkonto entsprechend Ihren Anforderungen, und verwenden Sie es dann für Ihren Hub. Alle nachfolgenden Projekte verwenden das Speicherkonto des Hubs. Weitere Informationen finden Sie unter Azure Storage-Redundanz. |
Container Registry | Microsoft | Konfigurieren Sie die Container Registry-Instanz für die Georeplikation von Registrierungen in die jeweilige Region des Regionspaars für Azure KI Studio. Verwenden Sie dieselbe Instanz für beide Hubinstanzen. Weitere Informationen finden Sie unter Georeplikation in Azure Container Registry. |
Application Insights | Sie | Erstellen Sie Application Insights für den Hub in beiden Regionen. Wenn Sie den Aufbewahrungszeitraum der Daten und Details anpassen möchten, lesen Sie Datenerfassung, -aufbewahrung und -speicherung in Application Insights. |
Damit eine schnelle Wiederherstellung und ein Neustart in der sekundären Region möglich sind, empfehlen sich die folgenden Entwicklungsmethoden:
- Verwenden Sie Azure Resource Manager-Vorlagen. Vorlagen sind „Infrastructure-as-Code“ und ermöglichen Ihnen die schnelle Bereitstellung von Diensten in beiden Regionen.
- Aktualisieren Sie die Continuous Integration- und Bereitstellungspipelines für die Bereitstellung in beiden Regionen, um Drift zwischen den beiden Regionen zu vermeiden.
- Erstellen Sie Rollenzuweisungen für Benutzer in beiden Regionen.
- Erstellen Sie Netzwerkressourcen wie Azure Virtual Networks und private Endpunkte für beide Regionen. Stellen Sie sicher, dass Benutzer Zugriff auf beide Netzwerkumgebungen haben. Beispielsweise VPN- und DNS-Konfigurationen für beide virtuellen Netzwerke.
Entwurf für Hochverfügbarkeit
Verfügbarkeitszonen
Bestimmte Azure-Dienste unterstützen Verfügbarkeitszonen. Bei Regionen, die Verfügbarkeitszonen unterstützen, gilt: Sollte eine Zone ausfallen, werden alle Projekt angehalten, und die Daten sollten gespeichert werden. Die Daten können jedoch nicht aktualisiert werden, bis die Zone wieder online ist.
Weitere Informationen finden Sie unter Dienst- und Regionsunterstützung für Verfügbarkeitszonen.
Bereitstellen wichtiger Komponenten in mehreren Regionen
Bestimmen Sie den Grad an Geschäftskontinuität, den Sie erreichen möchten. Der Grad kann sich zwischen den Komponenten Ihrer Lösung unterscheiden. Beispielsweise könnten Sie sich für eine Zugriffsebenenkonfiguration vom Typ „heiß/heiß“ für Produktionspipelines oder Modellimplementierungen und eine Zugriffsebenenkonfiguration vom Typ „heiß/kalt“ für die Entwicklung entscheiden.
Azure KI Studio ist ein regionaler Dienst und speichert Daten sowohl dienstseitig als auch in einem Speicherkonto in Ihrem Abonnement. Wenn ein regionaler Notfall auftritt, können Dienstdaten nicht wiederhergestellt werden. Sie können jedoch die vom Dienst gespeicherten Daten im Speicherkonto in Ihrem Abonnement wiederherstellen, sofern Speicherredundanz erzwungen wird. Dienstseitige gespeicherte Daten sind hauptsächlich Metadaten (Tags, Objektnamen und Beschreibungen). In Ihrem Speicherkonto sind normalerweise keine Metadaten gespeichert, z. B. hochgeladene Daten.
Für Verbindungen wird empfohlen, zwei separate Ressourcen in zwei unterschiedlichen Regionen zu erstellen und dann zwei Verbindungen für den Hub zu erstellen. Wenn KI Services beispielsweise eine wichtige Ressource für die Geschäftskontinuität ist, wäre das Erstellen von zwei KI Services-Ressourcen und zwei Verbindungen für den Hub eine gute Strategie für die Geschäftskontinuität. Wenn bei dieser Konfiguration eine Region ausfällt, ist immer noch eine Region betriebsbereit.
Stellen Sie für alle Hubs, die für die Geschäftskontinuität unerlässlich ist, Ressourcen in zwei Regionen bereit.
Isolierter Speicher
In dem Szenario, in dem Sie eine Verbindung mit Daten herstellen, um Ihre KI-Anwendung anzupassen, können Ihre Datasets in der Regel in Azure KI, aber auch außerhalb von Azure KI verwendet werden. Das Datasetvolume könnte ziemlich groß sein, daher empfiehlt es sich, diese Daten in einem separaten Speicherkonto zu speichern. Bewerten Sie, welche Datenreplikationsstrategie für Ihren Anwendungsfall am sinnvollsten ist.
Stellen Sie in KI Studio eine Verbindung mit Ihren Daten her. Wenn Sie über mehrere KI Studio-Instanzen in verschiedenen Regionen verfügen, verweisen Sie möglicherweise immer noch auf dasselbe Speicherkonto, da Verbindungen über Regionen hinweg funktionieren.
Initiieren eines Failovers
Fortsetzen der Arbeit im Failoverhub
Wenn Ihr primärer Hub nicht verfügbar ist, können Sie zum sekundären Hub wechseln, um die Entwicklung fortzusetzen. Azure KI Studio sendet keine automatischen Aufträge an den sekundären Hub, wenn ein Ausfall auftritt. Aktualisieren Sie die Codekonfiguration so, dass sie auf die neuen Hub- oder Projektressourcen verweist. Die Hartcodierung von Hub- oder Projektverweisen sollte vermieden werden.
Azure KI Studio kann Artefakte oder Metadaten nicht zwischen Hubs synchronisieren oder wiederherstellen. Abhängig von Ihrer Anwendungsbereitstellungsstrategie müssen Sie möglicherweise Artefakte in den Failoverhub verschieben oder neu erstellen, um den Vorgang fortzusetzen. Wenn Sie Ihren primären Hub und den sekundären Hub so konfigurieren, dass zugeordnete Ressourcen mit aktivierter Georeplikation gemeinsam verwendet werden, stehen einige Objekte möglicherweise direkt für den Failoverhub zur Verfügung. Dies gilt beispielsweise, wenn in beiden Hubs dieselben Docker-Images, konfigurierten Datenspeicher und Azure Key Vault-Ressourcen gemeinsam genutzt werden.
Hinweis
Aufträge, die ausgeführt werden, wenn ein Dienstausfall auftritt, werden nicht automatisch in den sekundären Hub überführt. Es ist auch unwahrscheinlich, dass die Aufträge im primären Hub fortgesetzt und erfolgreich abgeschlossen werden, sobald der Ausfall behoben wurde. Stattdessen müssen diese Aufträge erneut übermittelt werden, entweder im sekundären oder im primären Hub (sobald der Ausfall behoben wurde).
Wiederherstellungsoptionen
Ressourcenlöschung
Wenn ein Hub und seine vorhandenen Ressourcen versehentlich gelöscht werden, gibt es einige Ressourcen, in denen das vorläufige Löschen aktiviert ist, sodass die Ressourcenwiederherstellung möglich ist. Hubs und Projekte unterstützen kein vorläufiges Löschen. Ein gelöschter Hub oder ein gelöschtes Projekt kann nicht wiederhergestellt werden. Einige zugrunde liegende Ressourcen unterstützen möglicherweise das vorläufige Löschen, sodass sie ggf. wiederhergestellt werden können. In der Tabelle sehen Sie, für welche Dienste vorläufiges Löschen möglich ist.
Dienst | Vorläufiges Löschen aktiviert |
---|---|
Azure KI Studio-Hub | Nicht unterstützt |
Azure KI Studio-Projekt | Nicht unterstützt |
Azure KI Services-Ressource | Ja |
Azure Storage | Weitere Informationen finden Sie unter Wiederherstellen eines gelöschten Speicherkontos. |
Azure Key Vault | Ja |
Nächste Schritte
- Informationen zu sicheren Infrastrukturbereitstellungen mit Azure KI Studio finden Sie unter Erstellen eines sicheren Hubs.
- Weitere Informationen zur SLA finden Sie unter Vereinbarung zum Servicelevel für Azure.