什麼是向量搜尋?

已完成

向量搜尋是 AI 搜尋服務中可用來編製索引、儲存和擷取從搜尋索引內嵌向量的功能。 您可以使用它來為實作擷取擴增世代 (RAG) 架構、相似度和多重模式搜尋或建議引擎的應用程式提供動力。

以下是向量搜尋的索引編制和查詢工作流程圖例。

索引編製和查詢工作流程的圖表。

向量查詢可以透過提供機器學習模型所產生內容的數學標記法,用來比對不同來源資料類型的準則。 這可排除使用查詢意圖傳回相關結果之文字型搜尋的限制。

以下是您應該使用向量搜尋的一些案例:

  • 使用 OpenAI 或開放原始碼模型來編碼文字,並使用編碼為向量的查詢來擷取文件。
  • 跨編碼影像、文字、視訊和音訊,或混合 (多重模式) 執行相似性搜尋。
  • 使用多語系內嵌模型來代表不同語言的文件,以任何語言尋找文件。
  • 從向量和可搜尋文字欄位建置混合式搜尋,因為向量搜尋是在欄位層級實作。 結果將會合併以傳回單一回應。
  • 將篩選套用至文字和數值欄位,並在查詢中包含此篩選,以減少向量搜尋需要處理的資料。
  • 建立向量資料庫以提供外部知識庫或用為長期記憶體。

限制

使用向量搜尋時有一些限制,是您應該注意的:

  • 您必須使用 Azure OpenAI 或類似的開放原始碼解決方案來提供內嵌,因為 Azure AI 搜尋服務不會為您的內容產生這些。
  • 不支援客戶受控金鑰 (CMK)。
  • 有適用的儲存空間限制,因此您應該檢查您的服務配額提供的內容。

注意

如果您的文件很大,請考慮區塊化。 如需詳細資訊,請使用 AI 搜尋服務中向量搜尋解決方案的大型文件區塊化文件。