Condividi tramite


Carichi di lavoro di intelligenza artificiale in Azure

Queste linee guida affrontano le sfide dell'architettura della progettazione di carichi di lavoro di intelligenza artificiale, concentrandosi su funzionalità non deterministiche, dati e progettazione di applicazioni e operazioni. Le raccomandazioni si basano sui principi di Azure Well-Architected Framework (WAF) e includono informazioni dettagliate da implementazioni di Azure riuscite.

Questi articoli sono destinati ai proprietari dei carichi di lavoro e agli stakeholder tecnici, ad esempio architetti, responsabili dello sviluppo e responsabili IT. I ruoli specializzati di intelligenza artificiale e dati, ad esempio data scientist, devono anche essere consapevoli di queste linee guida perché la collaborazione tra diversi ruoli e team è un aspetto chiave.

Nota

Microsoft Azure offre un'ampia gamma di servizi di intelligenza artificiale che possono essere integrati nel carico di lavoro o basati su di esso. A seconda delle esigenze aziendali, è possibile scegliere tra soluzioni SaaS completamente gestite, soluzioni PaaS o creare una soluzione di intelligenza artificiale personalizzata. I servizi di Azure specifici e le relative funzionalità non sono trattati qui. Per questi, è consigliabile fare riferimento alla rispettiva documentazione del prodotto.

Inoltre, alcuni carichi di lavoro di intelligenza artificiale non sono inclusi nell'ambito, ad esempio:

  • Carichi di lavoro realizzati tramite offerte con poco codice e senza codice, ad esempio Microsoft Copilot Studio.
  • Carichi di lavoro che richiedono un'elaborazione ad alte prestazioni.
  • Carichi di lavoro che non implementano casi d'uso generativi o discriminanti di intelligenza artificiale.

Che cos'è un carico di lavoro di intelligenza artificiale?

Nel contesto di WAF, un carico di lavoro di intelligenza artificiale soddisfa le esigenze di attività predittive, discriminatorie o generative. Si concentra sulle funzionalità etiche, adattandosi alle tecnologie di IA in rapida evoluzione e rimanendo pertinenti e spiegabili. I pilastri WAF devono essere applicati a ogni punto decisionale per garantire che il sistema sia affidabile, sicuro, efficiente ed economico.

I carichi di lavoro di intelligenza artificiale sono diversi da quelli tradizionali perché sostituiscono funzionalità deterministiche in parti del carico di lavoro con un comportamento non deterministico che risolve le situazioni in cui i risultati fissi sono poco pratici. Combinano invece codice e dati in un'entità o in un modello, consentendo esperienze uniche che i sistemi tradizionali non possono fornire.

Prima di iniziare le strategie di progettazione, considerare prima questi punti chiave.

Acquisire familiarità con le grandi categorie di modelli

  • L'intelligenza artificiale generativa usa Machine Learning per creare in modo autonomo nuovi contenuti. Include modelli linguistici che possono essere personalizzati con i dati utente o usati come servizi come Azure OpenAI. Ad esempio, GPT, un tipo di modello linguistico, è specializzato nella simulazione del linguaggio di conversazione umana ed è ideale per le esperienze di chat e linguaggio naturale.

    Casi d'uso: l'intelligenza artificiale generativa può produrre articoli, storie, arte, generare dati sintetici per bilanciare i set di dati e rendere i chatbot più simili agli esseri umani.

  • L'intelligenza artificiale discriminante usa la programmazione esplicita per eseguire attività specifiche in base a regole e algoritmi. Può essere suddiviso in:

    • Basato su modello. Sistemi predittivi che trovano modelli, in base al training eseguito dalle osservazioni precedenti, per eseguire stime, ma non possono creare nuovi contenuti o adattarsi autonomamente.

    • Non basato su modello. Agenti autonomi che seguono regole predefinite per interagire con i sistemi, ad esempio i personaggi di videogiochi.

    Caso d'uso: l'intelligenza artificiale discriminante viene usata per l'analisi predittiva, i sistemi di raccomandazione e il rilevamento delle frodi.

Questa serie di articoli illustra diversi carichi di lavoro di intelligenza artificiale, concentrandosi su tipi specifici come i modelli linguistici quando necessario.

Importante

Quando si sceglie tra modelli generativi e discriminanti, considerare l'attività da eseguire. I modelli generativi creano nuovi dati, mentre i modelli discriminanti classificano i dati esistenti in base alle funzionalità. Per le attività di classificazione o regressione, selezionare modelli adatti al processo. Ad esempio, un modello linguistico che può classificare può essere più versatile di uno che classifica solo .

Valutare le opzioni di compilazione e acquisto

Se le risposte generiche sono accettabili, un modello predefinito o una soluzione basata su servizi di intelligenza artificiale che usa l'elaborazione opaca deve essere sufficiente per il carico di lavoro. Tuttavia, se sono necessari dati specifici per l'azienda o si hanno requisiti di conformità, è necessario creare un modello personalizzato.

Quando si sceglie tra un modello personalizzato, un modello predefinito o un servizio, considerare questi fattori:

  • Controllo dati. I modelli personalizzati offrono maggiore controllo sui dati sensibili. I modelli predefiniti sono più facili per le attività generali.

  • Personalizzazione. I modelli personalizzati sono migliori per esigenze specifiche. I modelli predefiniti possono non avere flessibilità.

  • Costo e manutenzione. I modelli personalizzati necessitano di manutenzione e risorse in corso. I modelli predefiniti hanno in genere costi iniziali inferiori e meno carico di infrastruttura.

  • Prestazioni. I servizi predefiniti offrono un'infrastruttura e una scalabilità ottimizzate. Sono ideali per esigenze di bassa latenza o scalabilità elevata.

  • Competenza. I modelli personalizzati richiedono un team esperto. I modelli predefiniti possono essere più rapidi da distribuire e semplificare l'uso se l'esperienza è limitata.

Importante

La creazione e la gestione del proprio modello richiedono molte risorse, tempo e competenze. È importante eseguire ricerche approfondite prima di decidere. In genere, la scelta di un modello predefinito o di un servizio gestito è un'opzione migliore.

Quali sono le sfide comuni?

  • Costi di calcolo. Le funzioni di intelligenza artificiale possono essere costose a causa di esigenze di calcolo elevate e le esigenze di calcolo possono variare in base alla progettazione del carico di lavoro. Comprendere i requisiti e scegliere il servizio appropriato per gestire i costi.

  • Requisiti di sicurezza e conformità. Le soluzioni predefinite potrebbero non soddisfare le esigenze di sicurezza e conformità. Opzioni di ricerca per evitare oneri non necessari.

  • Volume di dati. La gestione di volumi di dati di grandi dimensioni in vari formati comporta problemi di protezione delle informazioni sensibili e di un'elaborazione efficiente. Ottimizzare i costi di archiviazione, elaborazione e trasferimento deve essere un'attività in corso.

  • Decadimento del modello. I modelli possono degradare nel tempo, causando risultati imprecisi. Il test dei sistemi di intelligenza artificiale è complesso a causa della loro casualità.

  • Sfide relative alle competenze. I nuovi carichi di lavoro di intelligenza artificiale potrebbero richiedere ruoli specializzati e nuovi processi operativi che richiedono un training completo.

  • Ritmo dell'innovazione dell'IA. L'adozione delle tecnologie più recenti può essere tentata di rimanere all'avanguardia. Valutare attentamente le nuove tecnologie per assicurarsi di migliorare l'esperienza utente e non solo aggiungere complessità per l'aggiornamento.

  • Requisiti etici. È necessario determinare chiaramente se il caso d'uso è un obiettivo etico per l'IA. La gestione degli standard etici è necessaria in tutte le fasi di pianificazione e implementazione per assicurarsi di creare un sistema responsabile.

Come usare queste linee guida?

Inizia con Metodologia di progettazione, che delinea i temi razionali e ricorrenti in aree tecniche e operative. Questo approccio sistematico aiuta a definire i requisiti e le strategie di progettazione. Rivedere questa metodologia quando si riscontrano scelte incerte per rimanere allineati agli obiettivi complessivi del carico di lavoro. Fornisce anche un framework per collaborare con gli stakeholder per giustificare le decisioni tecniche e incorporare il feedback dei clienti per un miglioramento continuo.

Passare ai principi di progettazione per vedere in che modo la metodologia di progettazione è allineata ai pilastri principali del framework ben progettato, considerando l'evoluzione della crescita. Valutare i principi sottostanti per tutti i pilastri collettivamente, inclusi i compromessi.

Concentrarsi sulle aree di progettazione che hanno il maggior effetto sulla soluzione. Ogni area include considerazioni e consigli per guidare l'utente nelle decisioni di progettazione.

Usare lo strumento di revisione della valutazione per valutare l'idoneità del carico di lavoro ottimizzato per l'intelligenza artificiale nell'ambiente di produzione.

Modelli e aree di progettazione tipiche dell'architettura

Il diagramma mostra il modello di architettura tipico di un carico di lavoro di intelligenza artificiale.

L'architettura evidenzia l'integrazione di diversi componenti per abilitare l'elaborazione efficiente dei dati, l'ottimizzazione del modello e la distribuzione di applicazioni in tempo reale nelle soluzioni guidate dall'intelligenza artificiale. Include diversi moduli, ad esempio origini dati, elaborazione dati, training del modello, distribuzione di modelli e interfacce utente, che illustrano come i dati passano attraverso il sistema dalla raccolta iniziale all'interazione dell'utente finale.

Nella tabella seguente vengono descritte alcune aree di progettazione chiave correlate a tale modello.

Aree di progettazione
Progettazione dell'applicazione. Informazioni sulle considerazioni specifiche per i carichi di lavoro di intelligenza artificiale che potrebbero avere un effetto significativo sugli standard di progettazione delle applicazioni esistenti.
Piattaforma dell'applicazione. Determinare le piattaforme migliori da usare per supportare le funzioni del carico di lavoro di intelligenza artificiale, ad esempio l'hosting di modelli, il training del modello e l'inferenza.
Progettazione dei dati di training. Progettare strategie per l'inserimento dei dati, la pre-elaborazione, la conservazione e la governance per gestire i dati di training del modello.
Progettazione dei dati a terra. Strategie di progettazione per ottimizzare la ricerca e il recupero, rispettando al contempo i requisiti di sicurezza e conformità per i dati di base.
Piattaforma dati. Determinare la piattaforma di hosting migliore per gestire le grandi quantità e potenzialmente molti formati di dati usati dal carico di lavoro.
Operazioni di Machine Learning e operazioni di intelligenza artificiale generative. Definire procedure DevOps moderne per supportare le funzioni e i sistemi di intelligenza artificiale generativi o di Machine Learning.
Operazioni del carico di lavoro. Modernizzare le procedure operative con nuovi approcci e aggiungere ruoli e formazione specializzati.
Test e valutazione. Sviluppare strategie di test e valutazione per misurare caratteristiche quali accuratezza, precisione, sensibilità e specificità tramite metriche destinate specificamente ai carichi di lavoro di intelligenza artificiale.
Utenti del carico di lavoro. Comprendere in che modo gli utenti sono coinvolti nel ciclo di vita completo del carico di lavoro di intelligenza artificiale per garantire che il team sia completamente in grado di compilarlo e supportarlo.
IA responsabile. L'IA offre opportunità incredibili per nuovi prodotti e servizi, ma comporta anche un notevole grado di rischio. Prestare particolare attenzione all'esperienza utente e alle implicazioni etiche del rilascio della soluzione di intelligenza artificiale al pubblico.

Suggerimento

Ogni decisione architetturale prevede una serie di considerazioni e una serie di compromessi riconosciuti che bilanciano diversi aspetti del framework. Questi compromessi sono indicati da questa icona .

Passaggio successivo