Azure Cosmos DB でのベクトル検索
ベクトル検索は、プロパティ フィールドの完全一致ではなく、データ特性に基づいて類似項目を検索するのに便利な方法です。 この手法は、類似したテキストの検索、関連する画像の検索、おすすめ候補の作成、異常の検出などのアプリケーションで役立ちます。 これは、データとクエリのベクトル埋め込みを取得し、データ ベクトルとクエリ ベクトルとの間の距離を測定することによって機能します。 クエリ ベクトルに最も近いデータ ベクトルは、意味的に最も似ていると判明したものです。
例
このインタラクティブな視覚化に、ベクター間の近接性と距離の例をいくつか示します。
アルゴリズム
ベクトル検索アルゴリズムの 2 つの主な種類は、K ニアレスト ネイバー (kNN) と近似ニアレスト ネイバー (ANN) です。 kNN と ANN の 2 つのうちでは、後者が精度と効率のバランスがよく、大規模なアプリケーションに適しています。 一部のよく知られた ANN アルゴリズムには、反転ファイル (IVF)、階層ナビゲーション可能な小さい世界 (HNSW)、最新の DiskANN などがあります。
完全な機能を備えたデータベース (純粋なベクトル データベースではない) で統合ベクトル検索機能を使用すると、高次元ベクトル データを他のアプリケーション データと共に直接格納し、インデックス付けし、検索する効率的な方法が提供されます。 このアプローチは、データをコストの高い代替ベクトル データベースに移行する必要をなくし、AI 駆動型アプリケーションのシームレスな統合を実現します。