Raccomandazioni sulla governance per i carichi di lavoro di intelligenza artificiale nell'infrastruttura di Azure (IaaS)
Questo articolo fornisce raccomandazioni sulla governance per le organizzazioni che eseguono carichi di lavoro di intelligenza artificiale nell'infrastruttura di Azure (IaaS). Queste raccomandazioni consentono alle organizzazioni di definire un framework strutturato per la gestione delle risorse, il controllo dei costi, la sicurezza e l'efficienza operativa. Seguendo queste procedure, è possibile ridimensionare i carichi di lavoro di intelligenza artificiale in modo responsabile e assicurarsi che soddisfino gli obiettivi di conformità, sicurezza e finanziari.
Governance delle risorse
La governance delle risorse stabilisce regole e standard per la gestione delle risorse di Azure. Applicando i criteri di governance, le organizzazioni possono garantire la conformità, standardizzare l'uso delle risorse e controllare i costi, che supportano il ridimensionamento responsabile delle operazioni di IA.
Applicare l'utilizzo dei tag. Usare Criteri di Azure per applicare regole come la posizione delle risorse, gli SKU consentiti e i tag obbligatori. Ad esempio, creare criteri per limitare la distribuzione di determinate macchine virtuali ad alto costo, contribuendo a gestire i budget in modo efficace.
Applicare i criteri di governance per garantire la conformità e la standardizzazione. Usare Criteri di Azure per applicare regole quali la posizione delle risorse, gli SKU consentiti e i tag obbligatori. Ad esempio, creare criteri per limitare la distribuzione di determinate macchine virtuali a costi elevati per controllare il budget.
Usare i gruppi di risorse per la gestione del ciclo di vita. Distribuire le risorse di intelligenza artificiale all'interno di gruppi di risorse che condividono un ciclo di vita comune. I gruppi di risorse consentono di distribuire, configurare ed eliminare collettivamente le risorse. Forniscono anche limiti aggiuntivi di governance (criteri), sicurezza (controllo degli accessi in base al ruolo) e costi (budget).
Standardizzare le convenzioni di denominazione. Implementare una convenzione di denominazione standardizzata per le risorse di intelligenza artificiale. Questa pratica migliora il monitoraggio e la gestione. Usare le regole di denominazione e le restrizioni per ogni risorsa di Azure e seguire le abbreviazioni consigliate, poiché molte risorse spesso hanno restrizioni relative alla lunghezza del nome.
Gestire l'infrastruttura come codice. Usare Microsoft Defender per il cloud per monitorare e applicare la sicurezza IaC. Questo strumento consente di rilevare errori di configurazione IaC e garantisce distribuzioni sicure.
Gestione costi
Gestione costi monitora e controlla le spese correlate ai carichi di lavoro di intelligenza artificiale in Azure. Una gestione dei costi efficace consente alle organizzazioni di impostare budget, tenere traccia della spesa e mantenere la sostenibilità finanziaria per i progetti di IA.
Usare i tag per allocare i costi. Configurare una definizione di Criteri di Azure per applicare l'assegnazione di tag alle risorse. Usare i tag per classificare le risorse in base a progetto, centro di costo, ambiente e proprietario per una migliore gestione e fatturazione.
Usare l'ereditarietà dei tag. Usare l'ereditarietà dei tag in Gestione costi per applicare i tag di fatturazione, gruppo di risorse e sottoscrizioni ai record di utilizzo delle risorse figlio.
Gestire gli account di fatturazione. Usare fatturazione Microsoft per supervisionare gli account di fatturazione e gestire le fatture. Assegnare un account di fatturazione a ogni progetto o team di intelligenza artificiale per facilitare il rilevamento accurato delle spese.
Monitorare i costi. Usare Gestione costi Microsoft per impostare gli avvisi di budget, gli avvisi relativi alle anomalie dei costi e gli avvisi pianificati. Il monitoraggio dei costi in questo modo consente alle organizzazioni di mantenere la disciplina finanziaria.
Visualizzare i modelli di spesa. Usare l'analisi dei costi di Azure per esaminare regolarmente i modelli di spesa. Questo processo identifica le tendenze e rivela le aree per potenziali risparmi, in particolare nell'utilizzo delle macchine virtuali.
Consenti SKU di macchina virtuale specifici. Usare Criteri di Azure per consentire solo gli SKU delle macchine virtuali allineati al budget di intelligenza artificiale. La definizione di criteri predefinita Sku di macchina virtuale consentiti può applicare questo controllo.
Prendere in considerazione la scalabilità automatica. Usare un set di scalabilità di macchine virtuali per regolare dinamicamente i conteggi delle macchine virtuali in base alla domanda, ottimizzando i costi.
Configurare l'autoshutdown della macchina virtuale. Usare la funzionalità autoshutdown per pianificare l'arresto delle macchine virtuali durante gli orari di minore attività, riducendo i costi non necessari.
Governance della sicurezza
La governance della sicurezza risolve la necessità di misure di protezione affidabili nei carichi di lavoro di intelligenza artificiale. Implementando criteri di sicurezza e controlli di accesso, le organizzazioni possono proteggere dati e risorse sensibili. Riduce i rischi e supporta un ambiente di intelligenza artificiale sicuro in Azure.
Eseguire l'integrazione con Microsoft Entra ID. Usare Microsoft Entra ID per la gestione centralizzata delle identità e le funzionalità single sign-on (SSO) nei carichi di lavoro di intelligenza artificiale.
Implementare controlli di accesso distinti per ogni ambiente. Limitare l'identità di ogni pipeline di distribuzione all'ambiente designato, riducendo il rischio di distribuzioni accidentali.
Abilitare Azure Defender. Attivare Azure Defender per la protezione avanzata dalle minacce. Azure Defender migliora la sicurezza per i carichi di lavoro, tra cui macchine virtuali, account di archiviazione e database, promuovendo un solido comportamento di sicurezza per i carichi di lavoro di intelligenza artificiale.
Governance operativa
La governance operativa garantisce un monitoraggio e una gestione coerenti dei carichi di lavoro di intelligenza artificiale. Usando strumenti per il monitoraggio, gli avvisi e le distribuzioni automatizzate, le organizzazioni possono mantenere l'integrità del sistema, rilevare i problemi in anticipo e migliorare l'efficienza operativa, contribuendo a operazioni di IA affidabili e stabili.
Distribuire agenti di monitoraggio. Assicurarsi che gli agenti di Monitoraggio di Azure vengano distribuiti per impostazione predefinita per macchine virtuali, azure set di scalabilità di macchine virtuali e server connessi ad Azure Arc. Connetterli a un'area di lavoro Log Analytics centrale all'interno della sottoscrizione di gestione.
Configurare gli avvisi. Abilitare le regole di avviso consigliate per ricevere notifiche di deviazioni delle metriche.
Usare una pipeline CI/CD. Implementare l'integrazione continua e il recapito continuo (CI/CD) per automatizzare i test e la distribuzione del codice in ambienti diversi.