Come creare una soluzione RAG con Azure AI Search
Questa serie di esercitazioni illustra un modello per la creazione di soluzioni RAG in Azure AI Search. Vengono illustrati i componenti integrati in Ricerca di intelligenza artificiale di Azure, dipendenze e ottimizzazioni per ottimizzare la pertinenza e ridurre al minimo i costi.
I dati di esempio sono costituiti da una raccolta di PDF caricati in Archiviazione di Azure. Il contenuto è del libro di e-book gratuito della NASA.
Il codice di esempio è disponibile in questo notebook Python, ma è consigliabile usare gli articoli di questa serie per contesto, informazioni dettagliate e per l'esplorazione di approcci alternativi.
Esercizi della serie
Scegliere i modelli per incorporamenti e chat
Progettare un indice per la ricerca conversazionale
Progettare una pipeline di indicizzazione che carichi, blocchi, incorpori e inserisca i contenuti ricercabili
Recuperare i contenuti ricercabili usando query e un modello di chat
Ottimizzare la pertinenza
Ridurre al minimo i costi e l'archiviazione.
Sono stati omessi alcuni aspetti di un modello RAG per ridurre la complessità:
Nessuna gestione della cronologia e del contesto della chat. La cronologia delle chat deve essere archiviata e gestita separatamente dai dati di base, il che significa passaggi e codice aggiuntivi. Questa esercitazione presuppone domande atomiche e risposte dall'esperienza LLM e LLM predefinita.
Nessuna sicurezza dell'utente per utente sui risultati (ciò che si definisce "limitazione per motivi di sicurezza"). Per altre informazioni e risorse, iniziare con Limitazione per motivi di sicurezza e assicurarsi di esaminare i collegamenti alla fine dell'articolo.
Questa serie illustra i concetti fondamentali dello sviluppo di soluzioni RAG. Dopo aver compreso le nozioni di base, continuare con acceleratori e altri esempi di codice che forniscono un'astrazione maggiore o sono più adatti per gli ambienti di produzione e carichi di lavoro più complessi.
Perché usare Azure AI Search per RAG?
I modelli di chat affrontano le limitazioni della quantità di dati che possono accettare in una richiesta. È consigliabile usare Azure AI Search poiché la qualità di contenuti passati a un LLM può creare o interrompere una soluzione RAG.
Per fornire gli input di qualità più elevati a un modello di chat, Azure AI Search offre un motore di ricerca di classe migliore con l'integrazione dell'intelligenza artificiale e l'ottimizzazione completa della pertinenza. Il motore di ricerca supporta la ricerca di similarità vettoriale (più algoritmi), la ricerca di parole chiave, la ricerca fuzzy, la ricerca geospaziale e i filtri. È possibile compilare richieste di query ibride che includono tutti questi componenti ed è possibile controllare quanto contribuisce ogni query alla richiesta complessiva.