Vad är vektorsökning?
Vektorsökning är en funktion som är tillgänglig i AI Search som används för att indexera, lagra och hämta vektorinbäddning från ett sökindex. Du kan använda den för att driva program som implementerar RAG-arkitekturen (Retrieval Augmented Generation), likhets- och multimodala sökningar eller rekommendationsmotorer.
Nedan visas en bild av indexerings- och frågearbetsflöden för vektorsökning.
En vektorfråga kan användas för att matcha kriterier mellan olika typer av källdata genom att tillhandahålla en matematisk representation av innehållet som genereras av maskininlärningsmodeller. Detta eliminerar begränsningarna för textbaserade sökningar som returnerar relevanta resultat med hjälp av frågans avsikt.
När vektorsökning ska användas
Här följer några scenarier där du bör använda vektorsökning:
- Använd OpenAI- eller öppen källkod-modeller för att koda text och använda frågor som kodas som vektorer för att hämta dokument.
- Gör en likhetssökning mellan kodade bilder, text, video och ljud, eller en blandning av dessa (multimodal).
- Representera dokument på olika språk med hjälp av en inbäddad flerspråkig modell för att hitta dokument på valfritt språk.
- Skapa hybridsökningar från vektor- och sökbara textfält när vektorsökningar implementeras på fältnivå. Resultatet sammanfogas för att returnera ett enda svar.
- Använd filter för text och numeriska fält och inkludera detta i frågan för att minska de data som vektorsökningen behöver bearbeta.
- Skapa en vektordatabas för att tillhandahålla en extern kunskapsbas eller använda som ett långtidsminne.
Begränsningar
Det finns några begränsningar när du använder vektorsökning, vilket du bör notera:
- Du måste ange inbäddningarna med hjälp av Azure OpenAI eller en liknande öppen källkod lösning, eftersom Azure AI Search inte genererar dessa för ditt innehåll.
- Kundhanterade nycklar (CMK) stöds inte.
- Det finns lagringsbegränsningar som gäller, så du bör kontrollera vad din tjänstkvot tillhandahåller.
Kommentar
Om dina dokument är stora kan du överväga segmentering. Mer information finns i dokumentationen om stora segmenteringsdokument för vektorsökningslösningar i AI Search .