Ripristino di emergenza abilitato per il cliente

Articolo
12/05/2024

Importante

Gli elementi contrassegnati (anteprima) in questo articolo sono attualmente disponibili in anteprima pubblica. Questa anteprima viene fornita senza un contratto di servizio e non è consigliabile per i carichi di lavoro di produzione. Alcune funzionalità potrebbero non essere supportate o potrebbero presentare funzionalità limitate. Per altre informazioni, vedere le Condizioni supplementari per l'uso delle anteprime di Microsoft Azure.

Per ottimizzare il tempo di attività, pianificare in anticipo la continuità aziendale e prepararsi al ripristino di emergenza con Azure AI Foundry. Poiché Azure AI Foundry si basa sull'architettura di Azure Machine Learning, è utile fare riferimento all'architettura di base.

Microsoft si impegna per fare in modo che i servizi di Azure siano sempre disponibili. Potrebbero tuttavia verificarsi interruzioni dei servizi non pianificate. È consigliabile disporre di un piano di ripristino di emergenza per la gestione delle interruzioni del servizio a livello di area. In questo articolo vengono illustrate le operazioni seguenti:

Pianificare una distribuzione a più aree di Azure AI Foundry e le risorse associate.
Possibilità di recuperare log, notebook, immagini Docker e altri metadati.
Progettare per la disponibilità elevata della soluzione.
Avviare un failover in un'altra area.

Importante

Azure AI Foundry non fornisce failover automatico o ripristino di emergenza.

Informazioni sui servizi di Azure per Azure AI Foundry

Azure AI Foundry dipende da più servizi di Azure. È stato effettuato il provisioning di alcuni di questi servizi nella sottoscrizione. L'utente è responsabile della configurazione a disponibilità elevata di questi servizi. Microsoft gestisce alcuni servizi, creati in una sottoscrizione Microsoft.

I servizi di Azure includono:

Infrastruttura di Azure AI Foundry: un ambiente gestito da Microsoft per l'hub e il progetto di Azure AI Foundry. La [architettura sottostante](documentazione sull'architettura di Azure AI Foundry) viene fornita da Azure Machine Learning.
Risorse associate necessarie: risorse di cui è stato effettuato il provisioning nella sottoscrizione durante la creazione dell'hub e del progetto di Azure AI Foundry. Queste risorse includono Archiviazione di Azure e Azure Key Vault.
- L'archiviazione predefinita include dati come modello, dati di log di training e riferimenti agli asset di dati.
- Key Vault dispone di credenziali per Archiviazione di Azure e di connessioni.
Risorse associate facoltative: le risorse che è possibile collegare all'hub di Azure AI Foundry. Queste risorse includono Registro Azure Container e Application Insights.
- Registro Container ha un'immagine Docker per ambienti di training e inferenza.
- Application Insights è per il monitoraggio di Azure AI Foundry.
Istanza di ambiente di calcolo: risorsa creata dopo la distribuzione dell'hub. Ambienti di sviluppo di modelli gestiti da Microsoft.
Connessioni: Azure AI Foundry può connettersi a vari altri servizi. L'utente è responsabile della configurazione delle impostazioni di disponibilità elevata.

La tabella seguente illustra i servizi di Azure gestiti da Microsoft e quelli gestiti dall'utente. Indica anche i servizi a disponibilità elevata per impostazione predefinita.

Servizio	Gestito da	Disponibilità elevata per impostazione predefinita
Infrastruttura di Azure AI Foundry	Microsoft
Risorse associate
Archiviazione di Azure	Te
Key Vault	Te	✓
Registro Container	Te
Application Insights	Te	N/D
Risorse di calcolo
Istanza di calcolo	Microsoft
Qualsiasi connessione a servizi esterni, ad esempio i Servizi di Azure AI	Te

Nella parte restante di questo articolo vengono descritte le azioni da eseguire per rendere ognuno di questi servizi a disponibilità elevata.

Eseguire la pianificazione per la distribuzione in più aree

Una distribuzione a più aree si basa sulla creazione di Azure AI Foundry e altre risorse (infrastruttura) in due aree di Azure. Se si verifica un'interruzione a livello di area, è possibile passare all'altra area. Quando si pianifica la posizione in cui distribuire le risorse, prendere in considerazione:

Disponibilità a livello di area: se possibile, usare un'area nella stessa area geografica, non necessariamente quella più vicina. Per verificare la disponibilità a livello di area per Azure AI Foundry, vedere Prodotti Azure per area.
Aree abbinate di Azure: le aree abbinate coordinano gli aggiornamenti della piattaforma e assegnano priorità alle attività di ripristino dove necessario. Tuttavia, non tutte le aree supportano aree abbinate. Per altre informazioni, vedere Aree abbinate di Azure.
Disponibilità del servizio: decidere se le risorse usate dalla soluzione devono essere hot/hot (accesso frequente/accesso frequente), hot/warm (accesso frequente/accesso a frequenza media) o hot/cold (accesso frequente/accesso saltuario).
- Accesso frequente/accesso frequente: entrambe le aree sono attive contemporaneamente, con un'area pronta per iniziare immediatamente l'uso.
- Accesso frequente/accesso a frequenza media: l'area primaria è attiva, l'area secondaria ha delle risorse critiche (ad esempio, modelli distribuiti) pronte per l'avvio. Le risorse non critiche devono essere distribuite manualmente nell'area secondaria.
- Accesso frequente/sporadico: l'area primaria attiva, l'area secondaria include Azure AI Foundry e altre risorse distribuite, insieme ai dati necessari. È necessario distribuire manualmente risorse come modelli, distribuzioni di modelli o pipeline.

Suggerimento

A seconda dei requisiti aziendali, è possibile decidere di gestire diverse risorse di Azure AI Foundry in modo diverso.

Azure AI Foundry si basa su altri servizi. Alcuni servizi possono essere configurati per la replica in altre aree. Altri utenti devono essere creati manualmente in più aree. La tabella seguente fornisce un elenco di servizi, responsabili della replica e una panoramica della configurazione:

Servizio di Azure	Con replica geografica da	Impostazione
Hub e progetti di AI Foundry	Te	Creare un hub/progetti nelle aree selezionate.
Calcolo foundry di intelligenza artificiale	Te	Creare le risorse di calcolo nelle aree selezionate. Per le risorse di calcolo che possono essere ridimensionate in modo dinamico, assicurarsi che entrambe le aree forniscano una quota di calcolo sufficiente per le proprie esigenze.
Key Vault	Microsoft	Usare la stessa istanza di Key Vault con l'hub e le risorse di Azure AI Foundry in entrambe le aree. Key Vault esegue automaticamente il failover in un'area secondaria. Per altre informazioni, vedere Disponibilità e ridondanza in Azure Key Vault.
Account di archiviazione	Te	Azure Machine Learning non supporta il failover predefinito dell'account di archiviazione usando l'archiviazione con ridondanza geografica (GRS), l'archiviazione con ridondanza geografica della zona (GZRS), l'archiviazione con ridondanza geografica e accesso in lettura (RA-GRS) o l'archiviazione con ridondanza geografica della zona e accesso in lettura (RA-GZRS). Configurare un account di archiviazione in base alle proprie esigenze e quindi usarlo per l'hub. Tutti i progetti successivi usano l'account di archiviazione dell'hub. Per altre informazioni, vedere Ridondanza di Archiviazione di Azure.
Registro Container	Microsoft	Configurare l'istanza di Registro Container per replicare geograficamente i registri nell'area abbinata per Azure AI Foundry. Usare la stessa istanza per entrambe le istanze dell'hub. Per altre informazioni, vedere Replica geografica in Registro Azure Container.
Application Insights	Te	Creare Application Insights per l'hub in entrambe le aree. Per modificare il periodo di conservazione dei dati e i dettagli, vedere Raccolta, conservazione e archiviazione dei dati in Application Insights.

Per abilitare il ripristino rapido e il riavvio nell'area secondaria, è consigliabile seguire le procedure di sviluppo seguenti:

Usare i modelli di Azure Resource Manager. I modelli sono "infrastruttura come codice" e consentono di distribuire rapidamente i servizi in entrambe le aree.
Per evitare deviazioni tra le due aree, aggiornare le pipeline di integrazione continua e distribuzione per la distribuzione in entrambe le aree.
Creare assegnazioni di ruolo per gli utenti in entrambe le aree.
Creare risorse di rete, ad esempio reti virtuali di Azure ed endpoint privati per entrambe le aree. Assicurarsi che gli utenti abbiano accesso a entrambi gli ambienti di rete. Ad esempio, configurazioni VPN e DNS per entrambe le reti virtuali.

Progettare la disponibilità elevata

Zone di disponibilità

Alcuni servizi di Azure supportano le zone di disponibilità. Per le aree che supportano le zone di disponibilità, se una zona diventa inattiva, qualsiasi progetto viene sospeso ed è necessario salvare i dati. Tuttavia, i dati non possono essere aggiornati fino a quando la zona non torna online.

Per altre informazioni, vedere Supporto del servizio zona di disponibilità.

Distribuire componenti critici in più aree

Determinare il livello di continuità aziendale che si intende raggiungere. Il livello potrebbe variare tra i componenti della soluzione. Ad esempio, è possibile avere una configurazione ad accesso frequente/accesso frequente per le pipeline di produzione o le distribuzioni di modelli e ad accesso frequente/accesso saltuario per lo sviluppo.

Azure AI Foundry è un servizio a livello di area e archivia i dati sia sul lato servizio che su un account di archiviazione nella sottoscrizione. Se si verifica un'emergenza a livello di area, non è possibile recuperare i dati del servizio. Tuttavia, è possibile ripristinare i dati archiviati dal servizio nell'account di archiviazione della sottoscrizione in uso, a condizione che venga applicata la ridondanza dell'archiviazione. I dati archiviati sul lato servizio sono principalmente metadati (tag, nomi di asset, descrizioni), mentre quelli archiviati nell'account di archiviazione in genere non includono metadati, si tratta ad esempio di dati caricati.

Per le connessioni, è consigliabile creare due risorse separate in due aree distinte e quindi creare due connessioni per l'hub. Ad esempio, se i servizi di IA sono fondamentali per la continuità aziendale, la creazione di due risorse di Servizi di IA e di due connessioni per l'hub si rivela una buona strategia per la continuità aziendale. Con questa configurazione, se un'area diventa inattiva, c'è comunque un'altra area che rimane operativa.

Per tutti gli hub essenziali per la continuità aziendale, distribuire le risorse in due aree.

Spazio di memorizzazione isolato

Nello scenario in cui ci si connette ai dati per personalizzare l'applicazione di intelligenza artificiale, in genere i set di dati possono essere usati in Azure per intelligenza artificiale, ma anche all'esterno di quest'ultimo. Il volume del set di dati potrebbe essere piuttosto grande, quindi si consiglia di mantenere questi dati in un account di archiviazione separato. Valutare la strategia di replica dei dati più appropriata per il caso d'uso.

Nel portale di AI Foundry stabilire una connessione ai dati. Se sono presenti più istanze di AI Foundry in aree diverse, è comunque possibile puntare allo stesso account di archiviazione perché le connessioni funzionano tra aree.

Avviare un failover

Continuare a lavorare nell'hub di failover

Quando l'hub primario non è disponibile, è possibile passare all'hub secondario per continuare lo sviluppo. Azure AI Foundry non invia automaticamente processi all'hub secondario in caso di interruzione. Aggiornare la configurazione del codice in modo che punti alle nuove risorse dell'hub o del progetto. È consigliabile evitare riferimenti all'hub o al progetto con codifica fissa.

Azure AI Foundry non è in grado di sincronizzare o ripristinare artefatti o metadati tra hub. A seconda della strategia di distribuzione dell'applicazione, potrebbe essere necessario spostare o ricreare artefatti nell'hub di failover per continuare. Nel caso in cui l'hub primario e l'hub secondario siano stati configurati per condividere le risorse associate con la replica geografica abilitata, alcuni oggetti potrebbero essere direttamente disponibili per l'hub di failover. Ad esempio, se entrambi gli hub condividono le stesse immagini Docker, gli archivi dati configurati e le risorse di Azure Key Vault.

Nota

I processi che sono in esecuzione quando si verifica un'interruzione del servizio non passano automaticamente all'hub secondario. È anche improbabile che i processi vengano ripresi e completati correttamente nell'hub primario dopo la risoluzione dell'interruzione. Occorre piuttosto inviare di nuovo questi processi nell'hub secondario o primario (una volta risolta l'interruzione).

Opzioni di ripristino

Eliminazione delle risorse

Se un hub e le relative risorse esistenti vengono eliminati accidentalmente, sono presenti alcune risorse con eliminazione temporanea abilitata che possono essere ripristinate. Hub e progetti non supportano l'eliminazione temporanea. Non è possibile recuperare un hub o un progetto eliminato. Alcune risorse sottostanti potrebbero supportare l'eliminazione temporanea, quindi potrebbero essere recuperate. Vedere la tabella per sapere quali servizi dispongono di un'opzione di eliminazione temporanea.

Service	eliminazione temporanea abilitata
Hub di Azure AI Foundry	Non supportato
Progetto Azure AI Foundry	Non supportato
Risorsa di Servizi di Azure AI	Sì
Archiviazione di Azure	Vedere Ripristinare un account di archiviazione eliminato.
Azure Key Vault	Sì

Passaggi successivi

Per informazioni sulle distribuzioni sicure dell'infrastruttura con Azure AI Foundry, vedere Creare un hub sicuro.
Per informazioni sul contratto di servizio, vedere i contratti di servizio di Azure.

Condividi tramite