管理停用字詞檔 (SharePoint Server 2010)
適用版本: SharePoint Server 2010
上次修改主題的時間: 2015-03-09
「停用字詞」(又稱為「非搜尋字」) 是指搜尋系統在使用者搜尋查詢中會忽略的單字。如果某個單字在該語言中頻繁地出現,以致於它不可能對識別或縮小搜尋結果有任何協助,即可將其指定為「停用字詞」。例如,英語中通常會有 "an" 和 "the" 這類的冠詞指定停用字詞。如果使用者輸入英文查詢 "the highest mountain",則會從查詢中刪除是停用字詞的 "the";如此一來,查詢就會變成 "highest mountain"。不雅的字詞有時也會指定為停用字詞。
本文內容:
了解停用字詞檔
所指定之語言的停用字詞會列在該語言的「停用字詞檔」中。Microsoft SharePoint Server 2010 安裝程式會為該產品所支援的每種語言,自動安裝一個停用字詞檔。在安裝之後,許多停用字詞檔都會包含相關語言中一些常見的停用字詞。例如,美式英語的停用字詞檔 (noiseenu.txt) 預設會包含單詞 a、and、is、in、it、of、the 和 to。在產品安裝之後的任何時間點,搜尋管理員都可以在停用字詞檔中新增或移除字詞,以改善搜尋結果的關聯性或符合組織標準。如需在停用字詞檔中新增或移除字詞的資訊,請參閱本文稍後的<編輯停用字詞檔>。如需所支援語言的資訊,請參閱本文稍後的<按語言區分的停用字詞檔>。
在查詢時,所查詢語言的斷詞工具會根據語言的詞法規則確定單字的邊界,以識別搜尋查詢中的各個單字。然後,斷詞工具會從查詢中移除停用字詞檔內所列出的所有單字。
所有支援語言的停用字詞檔預設會安裝在 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config 中。當伺服器陣列管理員建立 Search Service 應用程式時,搜尋系統會自動從安裝位置將停用字詞檔 (包括搜尋管理員在此位置編輯過的任何停用字詞檔) 複製到 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config 中,此處的 GUID 為新 Search Service 應用程式的 GUID。搜尋系統會在執行新 Search Service 應用程式的每部查詢伺服器上,執行相同的操作。利用此方式,正在執行該 Search Service 應用程式的每部查詢伺服器上,都會有每個停用字詞檔的備份。
編輯停用字詞檔
如果在安裝位置中編輯停用字詞檔,系統會自動將編輯過的停用字詞檔,傳播到之後所建立的 Search Service 應用程式。但是,停用字詞檔不會自動傳播到現有的 Search Service 應用程式。針對您想要對其套用變更的每個現有 Search Service 應用程式,您必須在正執行該 Search Service 應用程式的每部查詢伺服器上,將已編輯的文件手動複製到 Search Service 應用程式資料夾中。
注意
-
如果刪除某個停用字詞檔,則搜尋系統可能會將所有的單一字元視為停用字詞,並將其從搜尋結果中移除。停用字詞檔中必須至少包含一個項目,即使該項目只是一個句點 (.) 字元亦可。
-
如果刪除了某個停用字詞檔後再重新啟動 SharePoint Server Search 14 服務,則搜尋系統會透過從 %Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config 中複製相同名稱的文件到已刪除該文件的資料夾,自動取代該文件。
使用下列程序可編輯停用字詞檔。
編輯停用字詞檔
確認執行此程序的使用者帳戶為本機伺服器管理員群組的成員。
在文字編輯器中開啟停用字詞檔。如需尋找及識別適當停用字詞檔的資訊,請參閱本文稍早的<了解停用字詞檔>。
編輯文件,使其僅包含您希望搜尋系統在搜尋查詢中忽略的字詞。
儲存停用字詞檔。
注意
儲存停用字詞檔時,請一律使用預設 [編碼] 值,也就是 [Unicode]。
遵循下列步驟重新啟動 SharePoint Server Search 14 服務:
按一下 [開始],然後指向 [系統管理工具],再按一下 [服務]。
以滑鼠右鍵按一下 [SharePoint Server Search 14],然後按一下 [重新啟動]。
在重新啟動 SharePoint Server Search 14 服務之後,停用字詞的變更才會生效。
注意
在 Microsoft Office SharePoint Server 2007 中,搜尋系統會從查詢與索引中排除停用字詞。因此,在管理員從停用字詞檔中刪除某個單字之後,有必要執行完整編目以對編目程式可能會遇到的該停用字詞出處進行索引編製。相反地,在 SharePoint Server 2010 中,搜尋系統僅會從查詢中排除停用字詞,根據設計,它並不會從索引中排除停用字詞。因此,在 SharePoint Server 2010 中,如果從停用字詞檔中移除了某個單字,則無需執行新的編目作業。這是因為在編目期間遇到該停用字詞時,該停用字詞已經存在於索引中。(如果在停用字詞檔中新增某個單字,也無需執行新的編目,因為搜尋系統不會在索引中尋找停用字詞)。
按語言區分的停用字詞檔
安裝 SharePoint Server 2010 時,會為下列語言安裝停用字詞檔。如果某個語言的停用字詞檔不存在,則搜尋系統將使用非特定語言的停用字詞檔 noiseneu.txt。
語言 | 停用字詞檔名稱 |
---|---|
阿拉伯文 |
noiseara.txt |
孟加拉文 |
noiseben.txt |
保加利亞文 |
noisebul.txt |
卡達隆尼亞文 |
noisecat.txt |
捷克文 |
noiseces.txt |
中文 (簡體) |
noisechs.txt |
中文 (繁體) |
noisecht.txt |
克羅埃西亞文 |
noisecro.txt |
丹麥文 |
noisedan.txt |
荷蘭文 (荷蘭) |
noisenld.txt |
英文 (英國) |
noiseeng.txt |
英文 (美國) |
noiseenu.txt |
芬蘭文 |
noisefin.txt |
法文 |
noisefra.txt |
德文 |
noisedeu.txt |
希臘文 |
noisegrc.txt |
古吉拉特文 |
noiseguj.txt |
希伯來文 |
noiseheb.txt |
印度文 |
noisehin.txt |
匈牙利文 |
noisehun.txt |
冰島文 |
noiseice.txt |
印尼文 |
noiseind.txt |
義大利文 |
noiseita.txt |
日文 |
noisejpn.txt |
坎那達文 |
noisekan.txt |
韓文 |
noisekor.txt |
中性語言 |
noiseneu.txt |
拉脫維亞文 |
noiselav.txt |
立陶宛文 |
noiselit.txt |
馬來文 |
noisemal.txt |
馬來亞拉姆文 |
noisemly.txt |
馬拉提文 |
noisemar.txt |
挪威文 (巴克摩) |
noisenor.txt |
波蘭文 |
noiseplk.txt |
葡萄牙文 (葡萄牙) |
noisepor.txt |
葡萄牙文 (巴西) |
noiseptb.txt |
旁遮普文 |
noisepun.txt |
羅馬尼亞文 |
noiserom.txt |
俄文 |
noiserus.txt |
塞爾維亞文 (斯拉夫) |
noisesbc.txt |
塞爾維亞文 (拉丁) |
noisesbl.txt |
斯洛伐克文 |
noisesvk.txt |
斯洛維尼亞文 |
noiseslo.txt |
西班牙文 |
noiseesn.txt |
瑞典文 |
noisesve.txt |
坦米爾文 |
noisetam.txt |
特拉古文 |
noisetel.txt |
泰文 |
noisetha.txt |
土耳其文 |
noisetur.txt |
烏克蘭文 |
noiseurk.txt |
烏都文 (巴基斯坦) |
noiseurd.txt |
越南文 |
noisevie.txt |