Dela via


Hämtning av förhöjd generering och index

I den här artikeln beskrivs vikten och behovet av RAG (Retrieval Augmented Generation) och index i generativ AI.

Vad är RAG?

Några grunderna först. Stora språkmodeller (LLM: er) som ChatGPT tränas på offentliga Internetdata som var tillgängliga vid den tidpunkt då de tränades. De kan svara på frågor som rör de data som de har tränats på. Dessa offentliga data kanske inte räcker för att uppfylla alla dina behov. Du kanske vill ha svar på frågor baserat på dina privata data. Eller så kan offentliga data helt enkelt ha blivit inaktuella. Lösningen på det här problemet är RAG (Retrieval Augmented Generation), ett mönster som används i AI som använder en LLM för att generera svar med dina egna data.

Hur fungerar RAG?

RAG är ett mönster som använder dina data med en LLM för att generera svar som är specifika för dina data. När en användare ställer en fråga genomsöks datalagret baserat på användarens indata. Användarfrågan kombineras sedan med matchande resultat och skickas till LLM med hjälp av en uppmaning (explicita instruktioner till en AI- eller maskininlärningsmodell) för att generera önskat svar. Den här processen kan illustreras på följande sätt.

Skärmbild av RAG-mönstret.

Vad är ett index och varför behöver jag det?

RAG använder dina data för att generera svar på användarfrågan. För att RAG ska fungera bra måste vi hitta ett sätt att söka efter och skicka dina data på ett enkelt och kostnadseffektivt sätt till LLM:erna. Detta uppnås med hjälp av ett index. Ett index är ett datalager som gör att du kan söka efter data effektivt. Det här indexet är mycket användbart i RAG. Ett index kan optimeras för LLM:er genom att skapa vektorer (textdata konverteras till talsekvenser med hjälp av en inbäddningsmodell). Ett bra index har vanligtvis effektiva sökfunktioner som nyckelordssökningar, semantiska sökningar, vektorsökningar eller en kombination av dessa. Det här optimerade RAG-mönstret kan illustreras på följande sätt.

Skärmbild av RAG-mönstret med index.

Azure AI tillhandahåller en indextillgång som ska användas med RAG-mönster. Indextillgången innehåller viktig information som var ditt index lagras, hur du kommer åt ditt index, vilka lägen indexet kan sökas i, har indexet vektorer, vilken inbäddningsmodell som används för vektorer osv. Azure AI-indexet använder Azure AI Search som primärt och rekommenderat indexarkiv. Azure AI Search är en Azure-resurs som stöder informationshämtning över dina vektor- och textdata som lagras i sökindex.

Nästa steg