Co to jest wyszukiwanie wektorów?
Wyszukiwanie wektorowe to funkcja dostępna w wyszukiwaniu sztucznej inteligencji służącym do indeksowania, przechowywania i pobierania osadzania wektorów z indeksu wyszukiwania. Można jej używać do obsługi aplikacji wdrażających architekturę generacji rozszerzonej (RAG), podobieństwo i wielomodalne wyszukiwania lub aparaty rekomendacji.
Poniżej przedstawiono ilustrację przepływów pracy indeksowania i zapytań na potrzeby wyszukiwania wektorów.
Zapytanie wektorowe może służyć do dopasowywania kryteriów dla różnych typów danych źródłowych, zapewniając matematyczną reprezentację zawartości generowanej przez modele uczenia maszynowego. Eliminuje to ograniczenia wyszukiwań opartych na tekście, zwracając odpowiednie wyniki przy użyciu intencji zapytania.
Kiedy należy używać wyszukiwania wektorowego
Poniżej przedstawiono kilka scenariuszy, w których należy używać wyszukiwania wektorów:
- Użyj modeli OpenAI lub open source, aby kodować tekst i używać zapytań zakodowanych jako wektory do pobierania dokumentów.
- Przeszukuj podobieństwo w zakodowanych obrazach, tekście, wideo i dźwięku lub kombinacji tych (wielomodalnych).
- Reprezentowanie dokumentów w różnych językach przy użyciu wielojęzycznego modelu osadzonego w celu znalezienia dokumentów w dowolnym języku.
- Twórz wyszukiwania hybrydowe z pól wektorowych i tekstowych z możliwością wyszukiwania wektorowego, ponieważ wyszukiwania wektorowe są implementowane na poziomie pola. Wyniki zostaną scalone w celu zwrócenia pojedynczej odpowiedzi.
- Zastosuj filtry do pól tekstowych i liczbowych i uwzględnij je w zapytaniu, aby zmniejszyć dane potrzebne do przetworzenia wyszukiwania wektorowego.
- Utwórz bazę danych wektorów, aby zapewnić zewnętrzną baza wiedzy lub użyć jako pamięci długoterminowej.
Ograniczenia
Podczas korzystania z wyszukiwania wektorowego należy pamiętać o kilku ograniczeniach:
- Musisz podać osadzanie przy użyciu usługi Azure OpenAI lub podobnego rozwiązania typu open source, ponieważ usługa Azure AI Search nie generuje tych elementów dla zawartości.
- Klucze zarządzane przez klienta (CMK) nie są obsługiwane.
- Istnieją ograniczenia magazynu, więc należy sprawdzić, co zapewnia limit przydziału usługi.
Uwaga
Jeśli dokumenty są duże, rozważ fragmentowanie. Aby uzyskać więcej informacji, skorzystaj z fragmentowania dużych dokumentów dla rozwiązań wyszukiwania wektorów w dokumentacji wyszukiwania sztucznej inteligencji.