Was ist die Vektorsuche?
Die Vektorsuche ist eine Funktion, die in der KI-Suche zum Indizieren, Speichern und Abrufen von Vektoreinbettungen aus einem Suchindex verfügbar ist. Sie können damit Anwendungen betreiben, die die Retrieval Augmented Generation (RAG)-Architektur, Ähnlichkeits- und multimodale Suchen oder Empfehlungsmaschinen implementieren.
Nachfolgend finden Sie eine Abbildung der Indizierungs- und Abfrageworkflows für die Vektorsuche.
Eine Vektorabfrage kann verwendet werden, um Kriterien über verschiedene Arten von Quelldaten hinweg abzugleichen, indem eine mathematische Darstellung des Inhalts bereitgestellt wird, der von Machine Learning-Modellen generiert wird. Dadurch werden die Einschränkungen von textbasierten Suchvorgängen überwunden, die relevante Ergebnisse mithilfe der Absicht der Abfrage zurückgeben.
Gründe für die Verwendung der Vektorsuche
Die Vektorsuche kann unter anderem in diesen Szenarien verwendet werden:
- Verwenden der OpenAI- oder Open Source-Modelle, um Text zu codieren, und verwenden von Abfragen, die als Vektoren codiert sind, um Dokumente abzurufen.
- Durchführen einer Ähnlichkeitssuche über codierte Bilder, Text, Video und Audio oder eine Mischung aus diesen (multimodal).
- Darstellen von Dokumenten in verschiedenen Sprachen mithilfe eines mehrsprachigen eingebetteten Modells, um Dokumente in einer beliebigen Sprache zu finden.
- Erstellen hybrider Suchvorgänge aus Vektor- und durchsuchbaren Textfeldern, da Vektorsuchen auf Feldebene implementiert werden. Die Ergebnisse werden zusammengeführt, um eine einzelne Antwort zurückzugeben.
- Anwenden von Filtern auf Text- und numerische Felder und Einfügen in Ihre Abfrage, um die Daten zu reduzieren, die Ihre Vektorsuche verarbeiten muss.
- Erstellen einer Vektordatenbank, um eine externe Wissensdatenbank bereitzustellen oder als Langzeitspeicher zu verwenden.
Begrenzungen
Es gibt einige Einschränkungen bei der Verwendung der Vektorsuche, die Sie beachten sollten:
- Sie müssen die Einbettungen mithilfe von Azure OpenAI oder einer ähnlichen Open Source-Lösung bereitstellen, da die Azure KI-Suche diese für Ihre Inhalte nicht generiert.
- Kundenseitig verwaltete Schlüssel (Customer Managed Keys, CMK) werden nicht unterstützt.
- Es gelten Speicherbeschränkungen, weshalb Sie überprüfen sollten, was Ihr Dienstkontingent bereitstellt.
Hinweis
Wenn Ihre Dokumente groß sind, sollten Sie eine Blockierung in Betracht ziehen. Weitere Informationen finden Sie in der Dokumentation Blockerstellung bei großen Dokumenten für Vektorsuchlösungen in der KI-Suche.