Herstel na noodgevallen door klant ingeschakeld
Belangrijk
Items die in dit artikel zijn gemarkeerd (preview) zijn momenteel beschikbaar als openbare preview. Deze preview wordt aangeboden zonder een service level agreement en we raden deze niet aan voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt. Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.
Als u uw uptime wilt maximaliseren, plant u vooruit om bedrijfscontinuïteit te behouden en voorbereidingen te treffen voor herstel na noodgevallen met Azure AI Foundry. Omdat Azure AI Foundry voortbouwt op azure Machine Learning-architectuur, is het handig om te verwijzen naar de basisarchitectuur.
Microsoft streeft ernaar om ervoor te zorgen dat Azure-services altijd beschikbaar zijn. Er kunnen echter niet-geplande servicestoringen optreden. We raden u aan een noodherstelplan in te stellen voor het afhandelen van regionale servicestoringen. In dit artikel leert u het volgende:
- Plan een implementatie met meerdere regio's van Azure AI Foundry en bijbehorende resources.
- Maximaliseer de kans om logboeken, notebooks, docker-installatiekopieën en andere metagegevens te herstellen.
- Ontwerp voor hoge beschikbaarheid van uw oplossing.
- Start een failover naar een andere regio.
Belangrijk
Azure AI Foundry zelf biedt geen automatische failover of herstel na noodgevallen.
Inzicht in Azure-services voor Azure AI Foundry
Azure AI Foundry is afhankelijk van meerdere Azure-services. Sommige van deze services worden ingericht in uw abonnement. U bent verantwoordelijk voor de configuratie van hoge beschikbaarheid van deze services. Microsoft beheert sommige services, die zijn gemaakt in een Microsoft-abonnement.
Azure-services zijn onder andere:
Azure AI Foundry-infrastructuur: een door Microsoft beheerde omgeving voor de Azure AI Foundry-hub en -project. De [onderliggende architectuur](Documentatie voor Azure AI Foundry-architectuur) wordt geleverd door Azure Machine Learning.
Vereiste gekoppelde resources: resources die zijn ingericht in uw abonnement tijdens het maken van een Azure AI Foundry-hub en het maken van projecten. Deze resources omvatten Azure Storage en Azure Key Vault.
- Standaardopslag bevat gegevens zoals model, trainingslogboekgegevens en verwijzingen naar gegevensassets.
- Key Vault heeft referenties voor Azure Storage en verbindingen.
Optionele gekoppelde resources: resources die u kunt koppelen aan uw Azure AI Foundry-hub. Deze resources omvatten Azure Container Registry en Application Insights.
- Container Registry heeft een Docker-installatiekopie voor trainings- en deductieomgevingen.
- Application Insights is bedoeld voor het bewaken van Azure AI Foundry.
Rekenproces: Resource die u maakt na de implementatie van de hub. Door Microsoft beheerde ontwikkelomgevingen voor modellen.
Verbindingen: Azure AI Foundry kan verbinding maken met verschillende andere services. U bent verantwoordelijk voor het cofigureren van hun instellingen voor hoge beschikbaarheid.
In de volgende tabel ziet u de Azure-services die Door Microsoft worden beheerd en de services die u beheert. Het geeft ook de services aan die standaard maximaal beschikbaar zijn.
Service | Beheerd door | Hoge beschikbaarheid standaard |
---|---|---|
Azure AI Foundry-infrastructuur | Microsoft | |
Gekoppelde resources | ||
Azure Storage | U | |
Key Vault | U | ✓ |
Container Registry | U | |
Analyses van toepassingen | U | N.v.t. |
Rekenresources | ||
Rekenproces | Microsoft | |
Elke verbinding met externe services , zoals Azure AI Services | U |
In de rest van dit artikel worden de acties beschreven die u moet ondernemen om elk van deze services maximaal beschikbaar te maken.
Plannen voor implementatie in meerdere regio's
Een implementatie in meerdere regio's is afhankelijk van het maken van Azure AI Foundry en andere resources (infrastructuur) in twee Azure-regio's. Als er een regionale storing optreedt, kunt u overschakelen naar de andere regio. Wanneer u van plan bent waar uw resources te implementeren, kunt u het volgende overwegen:
Regionale beschikbaarheid: gebruik indien mogelijk een regio in hetzelfde geografische gebied, niet noodzakelijkerwijs het gebied dat het dichtst bij zich ligt. Als u de regionale beschikbaarheid van Azure AI Foundry wilt controleren, raadpleegt u Azure-producten per regio.
Gekoppelde Azure-regio's: gekoppelde regio's coördineren platformupdates en prioriteren waar nodig herstelinspanningen. Niet alle regio's ondersteunen echter gekoppelde regio's. Zie Gekoppelde Azure-regio's voor meer informatie.
Beschikbaarheid van de service: bepaal of de resources die door uw oplossing worden gebruikt hot/hot, hot/warm of hot/cold moeten zijn.
- Dynamisch/dynamisch: beide regio's zijn tegelijkertijd actief, met één regio die direct kan worden gebruikt.
- Dynamisch/warm: primaire regio actief, secundaire regio heeft kritieke resources (bijvoorbeeld geïmplementeerde modellen) die klaar zijn om te starten. Niet-kritieke resources moeten handmatig worden geïmplementeerd in de secundaire regio.
- Dynamisch/koud: actieve primaire regio, secundaire regio heeft Azure AI Foundry en andere resources geïmplementeerd, samen met de benodigde gegevens. Resources zoals modellen, modelimplementaties of pijplijnen moeten handmatig worden geïmplementeerd.
Tip
Afhankelijk van uw bedrijfsvereisten kunt u besluiten om verschillende Azure AI Foundry-resources anders te behandelen.
Azure AI Foundry bouwt voort op andere services. Sommige services kunnen worden geconfigureerd voor replicatie naar andere regio's. Anderen die u handmatig moet maken in meerdere regio's. De volgende tabel bevat een lijst met services, die verantwoordelijk zijn voor replicatie en een overzicht van de configuratie:
Azure-service | Geo-replicatie door | Configuratie |
---|---|---|
Azure AI Foundry-hub en -projecten | U | Een hub/projecten maken in de geselecteerde regio's. |
Azure AI Foundry Compute | U | Maak de rekenresources in de geselecteerde regio's. Voor rekenresources die dynamisch kunnen worden geschaald, moet u ervoor zorgen dat beide regio's voldoende rekenquotum bieden voor uw behoeften. |
Key Vault | Microsoft | Gebruik hetzelfde Key Vault-exemplaar met de Azure AI Foundry-hub en resources in beide regio's. Key Vault voert automatisch een failover uit naar een secundaire regio. Zie Beschikbaarheid en redundantie in Azure Key Vault voor meer informatie. |
Opslagaccount | U | Azure Machine Learning biedt geen ondersteuning voor failover van standaardopslagaccounts met geografisch redundante opslag (GRS), geografisch zone-redundante opslag (GZRS), geografisch redundante opslag met leestoegang (RA-GRS) of geografisch zone-redundante opslag met leestoegang (RA-GZRS). Configureer een opslagaccount op basis van uw behoeften en gebruik dit vervolgens voor uw hub. Alle volgende projecten maken gebruik van het opslagaccount van de hub. Zie Redundantie in Azure Storage voor meer informatie. |
Container Registry | Microsoft | Configureer het Container Registry-exemplaar voor geo-replicatie van registers naar de gekoppelde regio voor Azure AI Foundry. Gebruik hetzelfde exemplaar voor beide hub-exemplaren. Zie Geo-replicatie in Azure Container Registry voor meer informatie. |
Analyses van toepassingen | U | Maak Application Insights voor de hub in beide regio's. Zie Gegevensverzameling, -retentie en -opslag in Application Insights om de gegevensretentieperiode en -details aan te passen. |
Als u snel herstel en opnieuw opstarten in de secundaire regio wilt inschakelen, raden we de volgende ontwikkelprocedures aan:
- Gebruik Azure Resource Manager-sjablonen. Sjablonen zijn 'infrastructuur als code' en bieden u de mogelijkheid om snel services in beide regio's te implementeren.
- Werk uw pijplijnen voor continue integratie en implementatie bij om te implementeren in beide regio's om drift tussen de twee regio's te voorkomen.
- Roltoewijzingen maken voor gebruikers in beide regio's.
- Maak netwerkbronnen, zoals Azure Virtual Networks en privé-eindpunten voor beide regio's. Zorg ervoor dat gebruikers toegang hebben tot beide netwerkomgevingen. Vpn- en DNS-configuraties bijvoorbeeld voor beide virtuele netwerken.
Ontwerpen voor hoge beschikbaarheid
Beschikbaarheidszones
Bepaalde Azure-services ondersteunen beschikbaarheidszones. Voor regio's die beschikbaarheidszones ondersteunen, wordt een zone onderbroken en moeten gegevens worden opgeslagen. De gegevens zijn echter niet beschikbaar om te vernieuwen totdat de zone weer online is.
Zie ondersteuning voor de beschikbaarheidszone voor meer informatie.
Essentiële onderdelen implementeren in meerdere regio's
Bepaal het niveau van bedrijfscontinuïteit waarnaar u op zoek bent. Het niveau kan verschillen tussen de onderdelen van uw oplossing. U wilt bijvoorbeeld een dynamische/dynamische configuratie hebben voor productiepijplijnen of modelimplementaties en dynamisch/koud voor ontwikkeling.
Azure AI Foundry is een regionale service en slaat gegevens zowel aan de servicezijde als in een opslagaccount in uw abonnement op. Als zich een regionale ramp voordoet, kunnen servicegegevens niet worden hersteld. Maar u kunt de gegevens die door de service in het opslagaccount in uw abonnement zijn opgeslagen, herstellen op basis van opslagredundantie. Opgeslagen gegevens aan de servicezijde zijn voornamelijk metagegevens (tags, assetnamen, beschrijvingen). Opgeslagen in uw opslagaccount zijn doorgaans niet-metagegevens, bijvoorbeeld geüploade gegevens.
Voor verbindingen raden we u aan twee afzonderlijke resources te maken in twee afzonderlijke regio's en vervolgens twee verbindingen voor de hub te maken. Als AI Services bijvoorbeeld een kritieke resource is voor bedrijfscontinuïteit, is het maken van twee AI Services-resources en twee verbindingen voor de hub een goede strategie voor bedrijfscontinuïteit. Als er met deze configuratie één regio uitvalt, is er nog steeds één regio operationeel.
Implementeer resources in twee regio's voor alle hubs die essentieel zijn voor bedrijfscontinuïteit.
Geïsoleerde opslag
In het scenario waarin u verbinding maakt met gegevens om uw AI-toepassing aan te passen, kunnen uw gegevenssets doorgaans worden gebruikt in Azure AI, maar ook buiten Azure AI. Het volume van de gegevensset kan behoorlijk groot zijn, dus het kan handig zijn om deze gegevens in een afzonderlijk opslagaccount te bewaren. Evalueer welke strategie voor gegevensreplicatie het meest zinvol is voor uw use-case.
Maak in de Azure AI Foundry-portal verbinding met uw gegevens. Als u meerdere Azure AI Foundry-exemplaren in verschillende regio's hebt, wijst u mogelijk nog steeds naar hetzelfde opslagaccount omdat verbindingen tussen regio's werken.
Een failover initiëren
Doorgaan met werken in de failoverhub
Wanneer uw primaire hub niet meer beschikbaar is, kunt u overschakelen naar de secundaire hub om door te gaan met ontwikkelen. Azure AI Foundry verzendt taken niet automatisch naar de secundaire hub als er een storing is. Werk de codeconfiguratie bij zodat deze verwijst naar de nieuwe hub- of projectbronnen. We raden u aan om hardcoderingshub- of projectverwijzingen te voorkomen.
Azure AI Foundry kan artefacten of metagegevens tussen hubs niet synchroniseren of herstellen. Afhankelijk van de implementatiestrategie van uw toepassing moet u mogelijk artefacten in de failoverhub verplaatsen of opnieuw maken om door te gaan. Als u uw primaire hub en secundaire hub configureert om gekoppelde resources te delen met geo-replicatie ingeschakeld, zijn sommige objecten mogelijk rechtstreeks beschikbaar voor de failoverhub. Als beide hubs bijvoorbeeld dezelfde Docker-installatiekopieën, geconfigureerde gegevensarchieven en Azure Key Vault-resources delen.
Notitie
Taken die worden uitgevoerd wanneer er een servicestoring optreedt, worden niet automatisch overgezet naar de secundaire hub. Het is ook onwaarschijnlijk dat de taken worden hervat en voltooid in de primaire hub zodra de storing is opgelost. In plaats daarvan moeten deze taken opnieuw worden ingediend in de secundaire hub of in de primaire hub (zodra de storing is opgelost).
Herstelopties
Verwijderen van resource
Als een hub en de bestaande resources per ongeluk worden verwijderd, zijn er enkele resources waarvoor voorlopig verwijderen is ingeschakeld, waardoor resourceherstel mogelijk is. Hubs en projecten bieden geen ondersteuning voor voorlopig verwijderen. Een hub of project dat wordt verwijderd, kan niet worden hersteld. Sommige onderliggende resources ondersteunen mogelijk voorlopig verwijderen, zodat ze mogelijk kunnen worden hersteld. Zie de tabel waarvoor services een optie voor voorlopig verwijderen hebben.
Service | voorlopig verwijderen ingeschakeld |
---|---|
Azure AI Foundry-hub | Niet ondersteund |
Azure AI Foundry-project | Niet ondersteund |
Azure AI Services-resource | Ja |
Azure Storage | Zie Een verwijderd opslagaccount herstellen. |
Azure Key Vault | Ja |
Volgende stappen
- Zie Een beveiligde hub maken voor meer informatie over veilige infrastructuurimplementaties met Azure AI Foundry.
- Zie de Azure-serviceovereenkomsten voor meer informatie over de SLA.