Azure Machine Learning come prodotto dati per l'analisi su scala cloud

Articolo
12/13/2024

Azure Machine Learning è una piattaforma integrata per la gestione del ciclo di vita di Machine Learning dall'inizio alla fine, inclusa l'assistenza per la creazione, il funzionamento e l'utilizzo di modelli e flussi di lavoro di Machine Learning. Alcuni vantaggi del servizio includono:

Le funzionalità supportano gli autori per aumentare la produttività aiutandoli a gestire esperimenti, accedere ai dati, tenere traccia dei processi, ottimizzare gli iperparametri e automatizzare i flussi di lavoro.
La capacità del modello da spiegare, riprodurre, controllare e integrare con DevOps, oltre a un modello di controllo di sicurezza avanzato, può supportare gli operatori per soddisfare i requisiti di governance e conformità.
Le funzionalità di inferenza gestita e l'integrazione affidabile con i servizi di calcolo e dati di Azure consentono di semplificare l'utilizzo del servizio.

Azure Machine Learning copre tutti gli aspetti del ciclo di vita dell'analisi scientifica dei dati. Include l'archiviazione dei dati e la registrazione del set di dati fino alla distribuzione del modello. Può essere usato per qualsiasi tipo di Machine Learning, dal Machine Learning classico al Deep Learning. Include l'apprendimento supervisionato e non supervisionato. Sia che si preferisca scrivere codice Python, codice R o utilizzare opzioni zero-code o low-code come strumenti di progettazione, è possibile creare, addestrare e monitorare modelli accurati di Machine Learning e Deep Learning in un'area di lavoro di Azure Machine Learning.

Azure Machine Learning, la piattaforma Azure e i servizi di intelligenza artificiale di Azure possono collaborare per gestire il ciclo di vita di Machine Learning. Un professionista di Machine Learning può usare Azure Synapse Analytics, il database SQL di Azure o Microsoft Power BI per iniziare ad analizzare i dati e passare ad Azure Machine Learning per la creazione di prototipi, la gestione della sperimentazione e l'operazionalizzazione. Nelle zone di destinazione di Azure, Azure Machine Learning può essere considerato un prodotto dati .

Azure Machine Learning nell'analisi su scala cloud

Una base del Cloud Adoption Framework (CAF) per le landing zone, le zone di atterraggio dei dati di analisi a scala cloud e la configurazione di Azure Machine Learning forniscono ai professionisti del Machine Learning un ambiente preconfigurato che consente loro di distribuire nuovi carichi di lavoro di machine learning o di migrare quelli esistenti in modo continuativo. Queste funzionalità possono aiutare i professionisti di Machine Learning a ottenere maggiore agilità e valore per il loro tempo.

I seguenti principi di progettazione possono guidare l'implementazione delle zone di destinazione di Azure Machine Learning:

Accesso accelerato ai dati: Preconfigurare i componenti di archiviazione nella landing zone come archivi dati nell'area di lavoro di Azure Machine Learning.
Collaborazione abilitata: Organizzare le aree di lavoro in base al progetto e centralizzare la gestione degli accessi per le risorse della zona di destinazione per supportare l'ingegneria dei dati, l'analisi scientifica dei dati e i professionisti di Machine Learning per collaborare.
implementazione sicura: Come impostazione predefinita per ogni distribuzione, seguire le procedure consigliate e usare l'isolamento della rete, l'identità e la gestione degli accessi per proteggere gli asset di dati.
self-service: I professionisti di Machine Learning possono ottenere maggiore agilità e organizzazione esplorando le opzioni per implementare nuove risorse di progetto.
Separazione delle problematiche tra la gestione dei dati e l'utilizzo dei dati: pass-through di identità è il tipo di autenticazione predefinito per Azure Machine Learning e l'archiviazione.
L'applicazione dati più veloce (allineata all'origine): Azure Data Factory, Azure Synapse Analytics e le zone di destinazione di Databricks possono essere preconfigurate per il collegamento ad Azure Machine Learning.
Observability: La registrazione centrale e le configurazioni di riferimento possono essere utili per monitorare l'ambiente.

Panoramica dell'implementazione

Nota

Questa sezione consiglia configurazioni specifiche per l'analisi su scala cloud. Integra la documentazione di Azure Machine Learning e le procedure consigliate di Cloud Adoption Framework.

Organizzazione e configurazione dell'area di lavoro

È possibile distribuire il numero di aree di lavoro di Machine Learning necessarie per i tuoi carichi di lavoro e per ogni zona di atterraggio distribuita. Le seguenti raccomandazioni possono aiutarti nella configurazione:

Distribuire almeno un'area di lavoro di Machine Learning per ogni progetto.
A seconda del ciclo di vita del progetto di Machine Learning, distribuire un'area di lavoro di sviluppo (sviluppo) per creare prototipi di casi d'uso ed esplorare i dati nelle prime fasi. Per il lavoro che richiede sperimentazione, test e distribuzione continui, distribuire un'area di lavoro di staging e produzione.
Quando sono necessari più ambienti per le aree di lavoro di sviluppo, collaudo e produzione in una data landing zone, si suggerisce di evitare la duplicazione dei dati, facendo in modo che ogni ambiente atterri nella stessa data landing zone di produzione.
Vedere Organizzare e configurare gli ambienti di Azure Machine Learning per altre informazioni su come organizzare e configurare le risorse di Azure Machine Learning.

Per ogni configurazione di risorsa predefinita in una zona di destinazione dei dati, un servizio Azure Machine Learning viene distribuito in un gruppo di risorse dedicato con le configurazioni e le risorse dipendenti seguenti:

Azure Key Vault
Application Insights
Registro Azure Container
Usare Azure Machine Learning per connettersi a un account di archiviazione di Azure e all'autenticazione basata sull'identità di Microsoft Entra per consentire agli utenti di connettersi all'account.
La registrazione diagnostica è configurata per ogni area di lavoro e impostata per una risorsa centrale di Log Analytics su scala aziendale; questo può aiutare a centralizzare l'analisi degli stati di integrità dei processi e delle risorse di Azure Machine Learning all'interno delle zone di destinazione e tra di esse.
Vedere Che cos'è un'area di lavoro di Azure Machine Learning? per altre informazioni sulle risorse e sulle dipendenze di Azure Machine Learning.

Integrazione con i servizi principali della zona di destinazione dei dati

La zona di destinazione dei dati include un set predefinito di servizi distribuiti nel livello dei servizi della piattaforma. Questi servizi di base possono essere configurati quando Azure Machine Learning viene distribuito nella zona di destinazione dei dati.

Connettere le aree di lavoro di Azure Synapse Analytics o Databricks come servizi collegati per integrare i dati ed elaborare Big Data.
Per impostazione predefinita, viene effettuato il provisioning dei servizi di data lake nella data landing zone, e le distribuzioni di prodotti Azure Machine Learning sono dotate di connessioni (archivi di dati) preconfigurate per questi account di archiviazione.

Panoramica dell'analisi dei prodotti dati per Azure Machine Learning.

Connettività di rete

La rete per l'implementazione di Azure Machine Learning nelle zone di destinazione di Azure è configurata seguendo le migliori pratiche di sicurezza per Azure Machine Learning e le migliori pratiche di rete CAF . Queste procedure consigliate includono le configurazioni seguenti:

Azure Machine Learning e le risorse dipendenti sono configurate per l'uso degli endpoint di collegamento privato.
Le risorse di calcolo gestite vengono distribuite solo con indirizzi IP privati.
La connettività di rete al repository di immagini di base pubblico di Azure Machine Learning e ai servizi partner come Azure Artifacts può essere configurata a livello di rete.

Gestione delle identità e degli accessi

Prendere in considerazione i consigli seguenti per la gestione delle identità utente e dell'accesso con Azure Machine Learning:

Gli archivi dati in Azure Machine Learning possono essere configurati per usare l'autenticazione basata su credenziali o identità. Quando si usano controllo di accesso e configurazioni data lake in Azure Data Lake Storage Gen2, configurare gli archivi dati per l'uso dell'autenticazione basata sull'identità; Ciò consente ad Azure Machine Learning di ottimizzare le autorizzazioni di accesso utente per l'archiviazione.
Usare i gruppi di Microsoft Entra per gestire le autorizzazioni utente per le risorse di archiviazione e Machine Learning.
Azure Machine Learning può usare identità gestite assegnate dall'utente per il controllo di accesso e limitare l'ambito di accesso al Registro Container di Azure, Key Vault di Azure, Archiviazione di Azure e Application Insights.
Creare identità gestite assegnate dall'utente ai cluster di calcolo gestiti creati in Azure Machine Learning.

Effettuare il provisioning dell'infrastruttura tramite self-service

È possibile abilitare e gestire il self-service con i criteri di per Azure Machine Learning. La tabella seguente elenca un set di criteri predefiniti quando si distribuisce Azure Machine Learning. Per ulteriori informazioni, vedere definizioni predefinite dei criteri di Azure Policy per Azure Machine Learning.

Politica	Digitare	Riferimento
Le aree di lavoro di Azure Machine Learning devono usare collegamento privato di Azure.	Incorporato	Visualizza nel portale Azure
Le aree di lavoro di Azure Machine Learning devono usare identità gestite assegnate dall'utente.	Incorporato	Visualizzazione nel portale di Azure
[Anteprima]: configurare i registri consentiti per i calcoli di Azure Machine Learning specificati.	Incorporato	Visualizzazione nel portale di Azure
Configurare le aree di lavoro di Azure Machine Learning con endpoint privati.	Incorporato	Visualizzazione nel portale di Azure
Configurare i calcoli di Machine Learning per disabilitare i metodi di autenticazione locale.	Incorporato	Visualizzazione nel portale di Azure
Aggiungi script di creazione di configurazione di calcolo per machine learning	Personalizzato (zone di destinazione del CAF - Cloud Adoption Framework)	visualizzazione su GitHub
Nega apprendimento automatico spazio di lavoro HBI	Custom (zone di destinazione CAF)	Visualizza su GitHub
Nega l'accesso pubblico all'apprendimento automatico quando dietro una rete virtuale	Custom (zone di destinazione del Cloud Adoption Framework)	Visualizzazione su GitHub
Deny-machinelearning-AKS	Custom (zone di destinazione del Cloud Adoption Framework)	Visualizzazione su GitHub
Deny-machinelearningcompute-subnetid	Custom (CAF zone di destinazione)	Visualizzazione su GitHub
Nega-macchinaapprendimentocomputazionale-dimensionemacchina	Personalizzate (zone di destinazione del Cloud Adoption Framework)	Visualizza su GitHub
Nega-accessopubblicoalportadell'loginremotodicluster-computazionemachinelearning	Custom (zone di destinazione CAF del Cloud Adoption Framework)	Visualizza su GitHub
Nega-scala-cluster-elaborazione-apprendimento-automatico	Custom (zone di destinazione del Framework per l'adozione del cloud - CAF)	visualizzazione su GitHub

Raccomandazioni per la gestione dell'ambiente

Le aree di destinazione per l'analisi dei dati su scala cloud forniscono un'implementazione di riferimento per distribuzioni ripetibili, che consentono di configurare ambienti gestibili e controllabili. Prendere in considerazione i consigli seguenti per l'uso di Azure Machine Learning per gestire l'ambiente:

Usare i gruppi di Microsoft Entra per gestire l'accesso alle risorse di Machine Learning.
Pubblicare un dashboard di monitoraggio centrale per monitorare l'integrità della pipeline, l'utilizzo delle risorse di calcolo e la gestione delle quote per Machine Learning.
Se si usano tradizionalmente criteri di Azure predefiniti e devono soddisfare requisiti di conformità aggiuntivi, creare criteri di Azure personalizzati per migliorare la governance e il self-service.
Per tenere traccia dei costi di ricerca e sviluppo, distribuire un'area di lavoro di Machine Learning nella zona di destinazione come risorsa condivisa durante le prime fasi dell'esplorazione del caso d'uso.

Importante

Utilizzare i cluster di Azure Machine Learning per l'addestramento di modelli di livello produttivo e Azure Kubernetes Service (AKS) per le distribuzioni di livello produttivo.

Consiglio

Usare Azure Machine Learning per i progetti di data science. Illustra il flusso di lavoro end-to-end con sottoservizi e funzionalità e consente al processo di essere completamente automatizzato.

Passaggi successivi

Usare il modello di Data Product Analytics e le linee guida per distribuire Azure Machine Learning e fare riferimento documentazione e esercitazioni di Azure Machine Learning per iniziare a creare le soluzioni.

Per continuare ad approfondire le procedure consigliate per la distribuzione e la gestione di Azure Machine Learning per le aziende, proseguite esaminando i seguenti quattro articoli del Framework di Adozione del Cloud:

Organizzare e configurare gli ambienti di Azure Machine Learning: Quando si pianifica una distribuzione di Azure Machine Learning, come influiscono le strutture del team, gli ambienti o l'area geografica delle risorse sul modo in cui vengono configurate le aree di lavoro?
procedure consigliate di Azure Machine Learning per la sicurezza aziendale: informazioni su come proteggere l'ambiente e le risorse con Azure Machine Learning.
Gestire budget, costi e quote per Azure Machine Learning su scala organizzativa: le organizzazioni devono affrontare molte sfide di gestione e ottimizzazione quando si gestiscono carichi di lavoro, team e costi di calcolo degli utenti sostenuti da Azure Machine Learning.
guida DevOps di Machine Learning: Machine Learning DevOps è un cambiamento organizzativo che si basa su una combinazione di persone, processi e tecnologie per offrire soluzioni di Machine Learning in modo robusto, scalabile, affidabile e automatizzato. Questa guida riepiloga le procedure consigliate e le informazioni per le aziende che usano Azure Machine Learning per adottare DevOps di Machine Learning.

Condividi tramite