ベクター検索とは

完了

"ベクトル検索" は、AI 検索で利用できる機能であり、検索インデックスからベクトル埋め込みのインデックス作成、保存、取得を行うために使用されます。 これを使用すると、検索により強化した文章生成 (RAG) アーキテクチャ、類似性およびマルチモーダル検索、またはレコメンデーション エンジンを実装するアプリケーションを強化できます。

ベクトル検索のインデックス作成とクエリ ワークフローを次に図示します。

インデックス作成とクエリのワークフローの図。

ベクトル クエリは、機械学習モデルによって生成されたコンテンツの数学的表現を提供することで、さまざまな種類のソース データ間で基準を一致させるために使用できます。 これにより、クエリの意図を使用して関連する結果を返すテキスト ベースの検索の制限が解消されます。

次にベクトル検索を使用すべきシナリオを示します。

  • OpenAI またはオープンソース モデルを使用してテキストをエンコードし、ベクトルとしてエンコードされたクエリを使用してドキュメントを取得します。
  • エンコードされた画像、テキスト、ビデオ、オーディオ、またはこれらの組み合わせ (マルチモーダル) で類似性検索を行います。
  • 多言語埋め込みモデルを使用してさまざまな言語でドキュメントを表し、すべての言語でドキュメントを検索できるようにします。
  • ベクトル検索はフィールド レベルで実装されることから、ベクトルと検索可能なテキスト フィールドからのハイブリッド検索を構築する。 結果はマージされ、1 つの応答が返されます。
  • テキストおよび数値フィールドにフィルターを適用し、これをクエリに含めて、ベクトル検索で処理する必要があるデータを減らします。
  • 外部ナレッジ ベースを提供したり、長期メモリとして使用するためのベクトル データベースを作成する。

制限事項

ベクトル検索を使用する場合、注意が必要な制限がいくつかあります。

  • Azure AI 検索ではコンテンツに対して埋め込みを生成しないため、Azure OpenAI または同様のオープンソース ソリューションを使用してこれらを提供する必要があります。
  • カスタマーマネージド キー (CMK) はサポートされていません。
  • ストレージには制限があるため、サービス クォータの提供内容を確認する必要があります。

Note

ドキュメントが大きい場合は、チャンクを検討してください。 詳細については、AI 検索でのベクトル検索ソリューション用の大きなドキュメントのチャンクに関するドキュメントを使用してください。