了解搜尋元件

已完成

AI 搜尋服務解決方案由多個元件所組成,每個元件在擷取、擴充、編制索引及搜尋資料的處理過程中,都扮演著重要的一部分。

資料來源

顯示資料來源概念圖例的圖表。

大部分搜尋解決方案都會以包含您要搜尋之資料的資料來源開始。 Azure AI 搜尋服務支援多種資料來源類型,包括:

  • Azure Blob 儲存體容器中的非結構化檔案。
  • Azure SQL Database 中的資料表。
  • Cosmos DB 中的文件。

Azure AI 搜尋服務可以從這些資料來源提取資料,以編製索引。

或者,應用程式可以直接將 JSON 資料推送至索引,而不需要從現有的資料存放區提取。

技能

技能概念圖例的圖表。

在基本搜尋解決方案中,您可對擷取自資料來源的資料編製索引。 可以擷取的資訊取決於資料來源。 例如,在編製資料庫中資料的索引時,可能會擷取資料庫資料表中的欄位;或者,在編製一批文件索引時,檔案中繼資料 (例如檔案名稱、修改日期、大小與作者) 都可能會與文件的文字內容一起擷取。

基本搜尋解決方案非常實用,其會對直接擷取自資料來源的資料值,編製索引,但新式應用程式使用者的期望已日漸轉往更豐富的資料見解需求。 在 Azure AI 搜尋服務中,您可以將人工智慧 (AI)「技能」套用為編製索引程序的一部分,以利用可對應至索引欄位的新資訊,擴充來源資料。 索引器所使用的技能,封裝在定義擴充管線的技能集中,而其中的每個步驟都會使用特定 AI 技能所取得的見解來改進來源資料。 AI 技能可擷取的資訊種類範例包括:

  • 撰寫文件所使用的語言。
  • 有助於判斷文件中所探討之主要重點或主題的關鍵片語。
  • 可量化文件正面或負面程度的情感分數。
  • 內容中提及的特定位置、人員、組織或地標。
  • AI 產生的影像描述,或是由光學字元辨識所擷取出的影像文字。
  • 開發以符合特定需求的專屬技能。

索引編製程式

顯示索引子概念圖例的圖表。

索引器是驅動整體索引程序的引擎。 其使用技能集中的技能所擷取的輸出,以及從原始資料來源中所擷取的資料與中繼資料值,並將其對應至索引中的欄位。

建立索引器時,會自動執行該索引器,而且可排程為固定間隔執行,或是視需要執行,以將更多文件新增至索引。 在某些情況下 (例如,當您將新欄位新增至索引,或是將新技能新增至技能集時),可能需要先重設索引,才能重新執行索引器。

索引

顯示索引概念圖例的圖表。

索引是可搜尋的索引程序結果。 其由 JSON 文件集合所組成,其中的欄位包含編製索引期間所擷取的值。 用戶端應用程式可以查詢索引,以擷取、篩選及排序資訊。

可使用下列屬性設定每個索引欄位:

  • 索引鍵:為索引記錄定義唯一索引鍵的欄位。
  • 可搜尋:可使用全文檢索搜尋進行查詢的欄位。
  • 可篩選:可包含在篩選運算式中的欄位,其只會傳回符合指定條件約束的文件。
  • 可排序:可用於排序結果的欄位。
  • 可 Facet:可用於決定 Facet 值的欄位 (使用者介面項目,這些項目可用於依據已知欄位值清單來篩選結果)。
  • 可擷取:可包含在搜尋結果中的欄位 (根據預設,除非已明確移除此屬性,否則所有欄位都可擷取)。