共用方式為


設定及管理全文檢索搜尋的停用字詞與停用字詞表

適用於:SQL ServerAzure SQL 資料庫

為精簡全文檢索索引,SQL Server 具有一種機制,可捨棄無助於搜尋卻經常出現的字串。 這些捨棄的字詞稱為 「停用字詞」。 在索引建立期間,全文搜尋引擎會從全文檢索索引中省略停用詞。 這代表全文檢索查詢不會搜尋停用字詞。

停用字詞。 停用字詞可能是具有特定語言意義的字詞。 例如,在英文中,"a"、"and"、"is" 及 "the" 等字會排除在全文檢索索引外,因為一般而言這些字都無助於搜尋。 停用字詞也可能是不具有語言意義的 Token

停用字詞表。 資料庫中的停用字詞是透過稱為停用字詞表的物件所管理。 「停用字詞表」是停用字詞的清單,與全文檢索索引相關聯時,會套用至該索引上的全文檢索查詢。

使用現有的停用字詞表

您可以以下列方式使用現有的停用詞表。

  • 在資料庫中使用系統提供的停用字詞清單。 SQL Server 隨附一份系統停用字詞表,其中包含每種支援語言的常用停用字詞,而且適用於預設與特定斷詞工具相關聯的每種語言。 您可以複製這份系統停用字詞表,並透過新增和移除停用字詞來自訂您的複本。

    系統停用字詞表是安裝在 資源 資料庫。

  • 在目前的伺服器執行個體中,使用來自其他資料庫的現有自訂停用字詞表,然後適當新增和卸除停用字詞。

建立新的停用字詞表

使用 Transact-SQL 建立新的停用字詞表

使用 CREATE FULLTEXT STOPLIST

使用 Management Studio 建立新的停用字清單

  1. 在 [物件總管] 中,展開伺服器。

  2. 展開 [資料庫],然後展開含有您要建立全文檢索停用字詞表的資料庫。

  3. 展開 [儲存體],然後以滑鼠右鍵按一下 [全文檢索停用字詞表]

  4. 選取 [新增全文檢索停用字詞表]

  5. 輸入新的停用字詞表名稱。

  6. 您可以選擇性地將其他人指定為停用字詞表的擁有者。

  7. 請選擇以下一個建立停用字表的選項:

    • 建立空的停用字詞表

    • 從系統阻止清單建立

    • 從現有全文檢索停用字詞表建立

    如需詳細資訊,請參閱全新全文檢索停用字詞表 (一般頁面)

  8. 選取 [確定]。

在全文檢索查詢中使用停用字詞表

若要在查詢中使用停用字詞表,您必須將其與全文檢索索引產生關聯。 您可以在建立索引時將停用字詞表附加到全文檢索索引,也可以之後再更改索引以加入停用字詞表。

建立全文檢索索引並將停用字詞表與其產生關聯

使用 CREATE FULLTEXT INDEX (Transact-SQL)

將停用字詞表與現有的全文檢索索引建立關聯或取消關聯

使用 ALTER FULLTEXT INDEX (Transact-SQL)

變更停用字詞表中的停用字詞

使用 Transact-SQL,在停用字詞表中新增或卸除停用字詞

使用 ALTER FULLTEXT STOPLIST (Transact-SQL)

使用 Management Studio,在停用字詞表中新增或卸除停用字詞

  1. 在 [物件總管] 中,展開伺服器。

  2. 展開 [資料庫],然後展開此資料庫。

  3. 展開 [儲存體],然後選取 [全文檢索停用字詞表]

  4. 以滑鼠右鍵按一下要變更屬性的停止清單,然後選取 [屬性]

  5. [全文檢索停用字詞表屬性] 對話方塊中:

    1. [動作] 清單方塊中,選取下列其中一個動作: [加入停用字詞][刪除停用字詞][刪除所有停用字詞][清除停用字詞表]

    2. 如果已針對選定動作啟用 [停用字詞] 文字方塊,請輸入單一停用字詞。 這個停用字詞必須是唯一的,亦即,尚未存在您所選取之語言的這個停用字詞表中。

    3. 如果已針對選定動作啟用 [全文檢索語言] 清單方塊,請選取語言。

  6. 選擇 [確定]。

管理停用字詞表和其使用方式

檢視停用字詞表中的所有停用字詞

使用 sys.fulltext_stopwords (Transact-SQL)

取得目前資料庫中所有停用字詞表的資訊

使用 sys.fulltext_stoplists (Transact-SQL)sys.fulltext_stopwords (Transact-SQL)

檢視斷詞工具、同義詞庫及停用字詞表組合的詞元化結果

使用 sys.dm_fts_parser (Transact-SQL)

如果停用字詞造成全文檢索查詢的布林運算導致失敗,則隱藏錯誤訊息

使用轉換噪音詞伺服器組態選項

停用字詞位置的詳細資訊

雖然全文索引會忽略停用字詞,但仍會考慮這些字詞的位置。 例如,這句話:「說明適用於這些 Adventure Works Cycles 型號。」 下表說明這些單字在片語中的位置:

Word 位置
指示 1
2
適用的 3
4
這些 5
冒險 6
作品 7
循環 8
模型 9

停用字詞 "are"、"to" 及 "these",分別在第 2、4 和第 5 位,這些文字都不會包含在全文檢索索引中。 但仍會保留這些文字的位置資訊,使句子中其他文字的位置不受影響。

從 SQL Server 2005 升級雜訊字

SQL Server 2005 (9.x) 噪音詞已經由停用字所取代。 當資料庫從 SQL Server 2005 (9.x) 升級時,將不再使用雜訊詞檔案。 不過,這些噪音字詞檔案會儲存在 FTDATA\ FTNoiseThesaurusBak 資料夾中,而且您之後可以在更新或建立對應的停用詞清單時使用它們。 如需將雜訊詞檔案升級為停用字詞表的資訊,請參閱 升級全文檢索