Condividi tramite


Raccomandazioni per la selezione delle risorse per i carichi di lavoro di intelligenza artificiale in Azure

Questo articolo offre raccomandazioni per la selezione delle risorse per le organizzazioni che eseguono carichi di lavoro di intelligenza artificiale in Azure. Si concentra sulle soluzioni PaaS (Platform-as-a-Service) di Azure AI, tra cui Azure AI Foundry, Azure OpenAI, Azure Machine Learning e Servizi di intelligenza artificiale di Azure. Vengono trattati sia carichi di lavoro generativi che non generici di intelligenza artificiale.

Fare scelte informate sulle risorse di intelligenza artificiale consente alle organizzazioni di ottenere prestazioni, scalabilità e efficienza migliori quando si gestiscono i carichi di lavoro di intelligenza artificiale. La tabella seguente offre una panoramica delle principali soluzioni PaaS per intelligenza artificiale di Azure e dei criteri decisionali importanti.

Piattaforma per intelligenza artificiale Tipo di intelligenza artificiale Descrizione Competenze richieste
OpenAI di Azure Intelligenza artificiale generativa Piattaforma per l'accesso ai modelli OpenAI Competenze per sviluppatori e data science
Azure AI Foundry Intelligenza artificiale generativa Piattaforma per la progettazione dei prompt e la distribuzione di endpoint di intelligenza artificiale generativi Competenze per sviluppatori e data science
Servizi di Azure AI Intelligenza artificiale analitica Piattaforma per l'utilizzo di modelli di Machine Learning predefiniti Competenze per sviluppatori
Azure Machine Learning Apprendimento automatico Piattaforma per il training e la distribuzione di modelli di Machine Learning Competenze per sviluppatori e competenze avanzate di data science

Selezionare le risorse per carichi di lavoro generativi di intelligenza artificiale

L'intelligenza artificiale generativa richiede la combinazione di risorse diverse per elaborare e generare output significativi in base ai dati di input. La selezione corretta garantisce che le applicazioni di intelligenza artificiale generative, ad esempio quelle che usano la generazione di un'intelligenza artificiale aumentata (RAG) di recupero, forniscano modelli di intelligenza artificiale accurati.

Diagramma che mostra i componenti di base di un carico di lavoro di intelligenza artificiale generativa.

In un carico di lavoro RAG tipico, (1) il carico di lavoro riceve la query dell'utente. (2) Un agente di orchestrazione, ad esempio Flusso prompt, Kernel semantico o LangChain, gestisce il flusso di dati. (3) Un meccanismo di ricerca e recupero trova i dati di base appropriati (4) da inviare all'endpoint di intelligenza artificiale generativa. (5) Un endpoint del modello di intelligenza artificiale generativo genera una risposta in base alla query dell'utente e ai dati di base. Usare i consigli seguenti come framework per creare carichi di lavoro RAG generativi.

  • Scegliere una piattaforma di intelligenza artificiale generativa. Usare Azure OpenAI o Azure AI Foundry per distribuire e gestire modelli di intelligenza artificiale generativi. Il servizio OpenAI di Azure consente di accedere ai modelli OpenAI di rete privata e ai filtri del contenuto. Azure AI Foundry offre una piattaforma "code-first" per sviluppare carichi di lavoro di intelligenza artificiale. Include strumenti predefiniti per la compilazione e la distribuzione di applicazioni. Include anche un catalogo di modelli di grandi dimensioni, un flusso di richieste, un'ottimizzazione, filtri di sicurezza del contenuto e altro ancora.

  • Scegliere il tipo di calcolo di intelligenza artificiale appropriato. Azure AI Foundry richiede istanze di calcolo per il flusso di prompt, la creazione di indici e l'apertura di Visual Studio Code (Web o Desktop) all'interno dello studio. Scegliere un tipo di calcolo in base alle esigenze di prestazioni e budget.

  • Selezionare un agente di orchestrazione. Gli agenti di orchestrazione più diffusi per l'intelligenza artificiale generativa includono semantic kernel, flusso prompt e LangChain. Il kernel semantico si integra con i servizi di Azure. LangChain offre estendibilità oltre l'ecosistema Microsoft.

  • Selezionare un meccanismo di ricerca e recupero delle informazioni. Per creare modelli di intelligenza artificiale generativi a terra, creare un database di indice o vettore per il recupero dei dati pertinente. Usare Ricerca di intelligenza artificiale di Azure per creare indici tradizionali e vettoriali da varie origini dati, applicare la suddivisione in blocchi dei dati e usare più tipi di query. Se i dati si trovano in database strutturati, è consigliabile usare Azure Cosmos DB, Database di Azure per PostgreSQL e cache di Azure per Redis.

  • Scegliere un'origine dati per i dati di base. Per immagini, audio, video o set di dati di grandi dimensioni, archiviare i dati di base in Archiviazione BLOB di Azure. In alternativa, usare i database supportati da Ricerca di intelligenza artificiale di Azure o database vettoriali.

  • Selezionare una piattaforma di calcolo. Usare l'albero delle decisioni di calcolo di Azure per scegliere la piattaforma appropriata per il carico di lavoro.

Selezionare le risorse per carichi di lavoro di intelligenza artificiale non generici

I carichi di lavoro di intelligenza artificiale non generici si basano su piattaforme, risorse di calcolo, origini dati e strumenti di elaborazione dati per supportare le attività di Machine Learning. La selezione delle risorse appropriate consente di creare carichi di lavoro di intelligenza artificiale usando soluzioni predefinite e personalizzate.

Diagramma che mostra i componenti di base di un carico di lavoro di intelligenza artificiale non generico.

In un carico di lavoro di intelligenza artificiale non generico (1) il carico di lavoro inserisce i dati. (2) Un meccanismo di elaborazione dati facoltativo estrae o modifica i dati in ingresso. (3) Un endpoint del modello di intelligenza artificiale analizza i dati. (4) I dati supportano il training o l'ottimizzazione dei modelli di intelligenza artificiale. Usare i consigli seguenti come framework per creare carichi di lavoro di intelligenza artificiale non generici.

  • Scegliere una piattaforma di intelligenza artificiale non generica.I servizi di intelligenza artificiale di Azure offrono modelli di intelligenza artificiale predefiniti che non richiedono competenze di data science. Per indicazioni su come selezionare il servizio di intelligenza artificiale di Azure corretto, vedere Scegliere una tecnologia dei servizi di intelligenza artificiale di Azure. Azure Machine Learning offre una piattaforma per creare modelli di Machine Learning con i propri dati e usarli nei carichi di lavoro di intelligenza artificiale.

  • Scegliere l'ambiente di calcolo di intelligenza artificiale appropriato. Per Azure Machine Learning, sono necessarie risorse di calcolo per eseguire un processo o ospitare un endpoint. Usare il tipo di calcolo che soddisfa le esigenze di prestazioni e budget. I servizi di intelligenza artificiale di Azure non richiedono risorse di calcolo.

  • Selezionare un'origine dati. Per Azure Machine Learning, usare una delle origini dati supportate per ospitare i dati di training. Per i servizi di intelligenza artificiale di Azure, molti dei servizi non richiedono l'ottimizzazione dei dati e alcuni, ad esempio i Visione personalizzata di Intelligenza artificiale di Azure, offrono un'opzione per caricare i file locali in una soluzione di archiviazione dati gestita.

  • Selezionare una piattaforma di calcolo. Usare l'albero delle decisioni di calcolo di Azure per scegliere la piattaforma del carico di lavoro corretta.

  • Selezionare un servizio di elaborazione dati (facoltativo). Funzioni di Azure è una scelta comune per l'elaborazione dei dati perché offre un'opzione serverless. Griglia di eventi di Azure è anche un meccanismo di trigger comune per avviare una pipeline di elaborazione dati.

Passaggio successivo