Поиск вектора в Azure Cosmos DB
Векторный поиск — это метод, который помогает находить аналогичные элементы на основе их характеристик данных, а не по точным совпадениям в поле свойства. Этот метод полезен в таких приложениях, как поиск аналогичного текста, поиск связанных изображений, рекомендации или даже обнаружение аномалий. Он работает путем внедрения векторов данных и запросов, а затем измерения расстояния между векторами данных и вектором запроса. Векторы данных, близкие к вектору запросов, являются наиболее похожими семантикой.
Примеры
Эта интерактивная визуализация показывает некоторые примеры близкости и расстояния между векторами.
Алгоритмы
Двумя основными типами алгоритмов поиска векторов являются ближайшие соседи (kNN) и приблизительные ближайшие соседи (ANN). Между kNN и ANN последний предлагает баланс между точностью и эффективностью, что делает его более подходящим для крупномасштабных приложений. Некоторые известные алгоритмы ANN включают инвертированные файлы (IVF), иерархический навигационируемый небольшой мир (HNSW) и состояние диска.
Использование встроенной функции поиска векторов в полнофункциональной базе данных (в отличие от чистой векторной базы данных) обеспечивает эффективный способ хранения, индексирования и поиска высокомерных векторных данных непосредственно вместе с другими данными приложения. Этот подход устраняет необходимость переноса данных в дорогостоящие альтернативные векторные базы данных и обеспечивает простую интеграцию приложений, управляемых ИИ.