共用方式為


將搜尋所使用的文字分隔還原為舊版 (SQL Server 搜尋)

適用於:SQL ServerAzure SQL 資料庫

針對全文檢索搜尋支援的所有語言 (韓文除外),SQL Server 會安裝並啟用特定版本的斷詞工具和詞幹分析器。 本文描述如何從這些元件的這個版本切換成舊版,或從舊版切換回新版。

本文不討論以下語言:

  • 英文。 若要還原英文內容,請參閱變更用於美式英文與英式英文的斷詞工具

  • 丹麥文、波蘭文和土耳其文: 舊版 SQL Server 隨附丹麥文、波蘭文及土耳其文的第三方斷詞工具,現已取代為 Microsoft 元件。

  • 捷克文和希臘文: 目前有捷克文和希臘文的新斷詞工具。 舊版 SQL Server 全文檢索搜尋不支援這兩種語言。

  • 韓文: 韓文的斷詞工具和字幹分析器在此版本中未升級。

如需斷詞工具與字幹分析器的一般資訊,請參閱 設定及管理搜尋的斷詞工具與字幹分析器

還原和復原斷詞工具與字幹分析器的概觀

復原與恢復斷詞工具和字幹分析器的操作說明取決於語言。 下表摘要說明還原為舊版元件可能需要的三組動作。

目前檔案 舊版檔案 受影響語言的數目 檔案操作 登錄項目的動作
NaturalLanguage6.dll NaturalLanguage6.dll 34 取得及安裝舊版 NaturalLanguage6.dll,並覆寫目前版本的檔案。 不需要任何動作。

此版本中未變更登錄機碼和值。
(其他檔案名稱) NaturalLanguage6.dll 5 取得及安裝舊版 NaturalLanguage6.dll,並覆寫目前版本的檔案。 變更一組登錄項目以指定舊版元件。
(其他檔案名稱) (其他檔案名稱) 6 不需要任何動作。

SQL Server 安裝程式會將目前版本和舊版元件都複製到 Binn 資料夾中。
變更一組登錄項目以指定舊版元件。

警告

如果您以其他版本取代目前版本的 NaturalLanguage6.dll 檔案,則使用此檔案的所有語言的行為都會受到影響。

本文說明的檔案,是安裝在 SQL Server 執行個體 MSSQL\Binn 資料夾中的 DLL 檔案。 完整路徑通常是以下路徑:

C:\Program Files\Microsoft SQL Server\<instance>\MSSQL\Binn

目前和舊版斷詞工具的檔案名稱都是 NaturalLanguage6.dll 的語言

在下表中的語言,目前和舊版斷詞工具的檔案名稱都是 NaturalLanguage6.dll。 若要還原這些元件,您必須以相同檔案的不同版本覆寫 NaturalLanguage6.dll。 您不必變更任何登錄項目,因為此版本中未變更這些登錄項目。

警告

如果您以其他版本取代目前版本的 NaturalLanguage6.dll 檔案,則使用此檔案的所有語言的行為都會受到影響。

受影響語言的清單

語言 縮寫
用於
註冊表
地區設定識別碼 (LCID)
孟加拉文 ben 1093
保加利亞文 bgr 1026
卡達隆尼亞文 cat 1027
西班牙文 esn 3082
法文 fra 1036
古吉拉特文 guj 1095
希伯來文 heb 1037
印地語 hin 1081
克羅埃西亞文 hrv 1050
印尼文 ind 1057
冰島文 isl 1039
義大利文 ita 1040
坎那達文 kan 1099
立陶宛文 lth 1063
拉脫維亞文 lvi 1062
馬來亞拉姆文 mal 1100
馬拉地文 mar 1102
馬來文 msl 1086
中性 Neutral 0000
挪威書面語(巴克摩標準) nor 1044
旁遮普文 pan 1094
葡萄牙文 (巴西) ptb 1046
葡萄牙文 ptg 2070
羅馬尼亞文 rom 1048
斯洛伐克文 sky 1051
斯洛維尼亞文 slv 1060
塞爾維亞文 - 西里爾字母 srb 3098
塞爾維亞文 (拉丁) srl 2074
瑞典文 sve 1053
坦米爾文 tam 1097
泰盧固文 tel 1098
烏克蘭文 ukr 1058
烏都文 urd 1056
越南文 vit 1066

上表依縮寫欄位的字母順序排列。

回復至先前元件

  1. 導覽至上述 Binn 資料夾。

  2. 將 SQL Server 版本的 NaturalLanguage6.dll 備份至另一個位置。

  3. 將舊版 NaturalLanguage6.dll 從 SQL Server 2008 R2 (10.50.x) 或 SQL Server 2008 (10.0.x) 的 Binn 資料夾,複製到 SQL Server 執行個體的 Binn 資料夾中。

    警告

    此變更影響在目前版本和舊版中都使用 NaturalLanguage6.dll 的所有語言。

  4. 重新啟動 SQL Server。

若要還原目前元件

  1. 瀏覽至您備份 SQL Server 版本的 NaturalLanguage6.dll 的位置。

  2. 將目前版本的 NaturalLanguage6.dll 從備份位置複製到 SQL Server 執行個體的 Binn 資料夾。

    警告

    此變更影響在目前版本和舊版中都使用 NaturalLanguage6.dll 的所有語言。

  3. 重新啟動 SQL Server。

僅舊版斷詞工具的檔案名稱是 NaturalLanguage6.dll 的語言

在下表中的語言,舊版斷詞工具的檔案名稱不同於新版檔案名稱。 舊版檔案名稱為 NaturalLanguage6.dll。 若要還原為先前版本,您必須以先前版本的 NaturalLanguage6.dll 檔案,覆寫目前的版本。 您也必須變更一組登錄項目,以指定舊版或目前版本的元件。

警告

如果您以其他版本取代目前版本的 NaturalLanguage6.dll 檔案,則使用此檔案的所有語言的行為都會受到影響。

受影響語言的清單

語言 縮寫
用於
註冊表
區域識別碼 (LCID)
阿拉伯文 ara 1025
德文 deu 1031
日文 jpn 1041
荷蘭文 荷蘭 (assuming "nld" stands for Netherlands in ISO country code) 1043
俄文 rus 1049

上表依據縮寫欄的字母順序排序。

請將以下指示與< 用於還原斷詞工具和字幹分析器的檔案名稱和登錄值>一節的值清單一起使用。

若要還原至先前的元件

  1. 導覽至上述 Binn 資料夾。

  2. 不要從 Binn 資料夾中移除目前元件版本的檔案。

  3. 將 SQL Server 版本的 NaturalLanguage6.dll 備份至另一個位置。

  4. 將舊版 NaturalLanguage6.dll 從 SQL Server 2008 R2 (10.50.x) 或 SQL Server 2008 (10.0.x) 的 Binn 資料夾,複製到新 SQL Server 執行個體的 Binn 資料夾中。

    警告

    此變更影響在目前版本和舊版中都使用 NaturalLanguage6.dll 的所有語言。

  5. 在登錄中,瀏覽至下列節點:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID

  6. 使用下列步驟,為選定語言的之前的斷詞工具和字幹分析器介面新增 COM ClassID 的新機碼:

    1. 新增一個鍵,並將表格中先前斷詞工具的值賦予該鍵。

    2. 將該機碼值的 (預設值) 資料更新為表格中舊版斷詞工具的檔案名稱。

    3. 如果選定的語言使用詞幹分析器,則新增一個與之前詞幹分析器的值對應的新鍵值。

    4. 如果選取的語言使用字幹分析器,則將該機碼值的 (預設值) 資料更新為表格中先前字幹分析器的檔案名稱。

  7. 在登錄中,瀏覽至下列節點HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key> <language_key> 代表登錄中所用語言的縮寫,例如「fra」代表法文,「esn」則代表西班牙文。

  8. WBreakerClass 鍵值更新為表格中當前使用的斷詞工具的值。

  9. 如果所選語言使用詞幹分析器,則將 StemmerClass 鍵值更新為表格中當前詞幹分析器的值。

  10. 重新啟動 SQL Server。

若要還原目前的元件

  1. 瀏覽至備份了 SQL Server 版本的 NaturalLanguage6.dll 的位置。

  2. 將目前版本的 NaturalLanguage6.dll 從備份位置複製到 SQL Server 執行個體的 Binn 資料夾。

    警告

    此變更影響在目前版本和舊版中都使用 NaturalLanguage6.dll 的所有語言。

  3. 在登錄中,瀏覽至下列節點:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID

  4. 如果下列機碼不存在,請使用下列步驟,針對選定語言的目前斷詞工具和字幹分析器介面加入 COM ClassID 的新機碼:

    1. 加入一個新的鍵,取自表格的值,用於目前的斷詞工具。

    2. 將該鍵值的 (預設) 資料更新為表格中目前使用的斷詞工具的檔案名稱。

    3. 如果選取的語言使用字幹分析器,則加入具有表格中目前字幹分析器的值的新鍵。

    4. 如果選取的語言使用字幹分析器,則將該鍵值的 (預設值) 資料更新為表格中目前字幹分析器的檔案名稱。

  5. 在登錄中,瀏覽至下列節點HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key> <language_key> 代表登錄中所用語言的縮寫,例如「fra」代表法文,「esn」則代表西班牙文。

  6. WBreakerClass 鍵值更新為表格中前一個斷詞工具的值。

  7. 如果選取的語言使用字幹分析器,則將 StemmerClass 機碼值更新為表格中舊版字幹分析器的值。

  8. 重新啟動 SQL Server。

用於恢復斷詞工具和字幹分析器的檔案名稱和註冊表值

將下列的檔案名稱和登錄項目清單與上一節中的指示一起使用。 使用舊版值還原為舊版,或使用目前值還原目前版本的元件。

下列清單依各語言縮寫的字母順序排序。

阿拉伯文 (ara),LCID 1025

元件 斷詞工具 詞幹分析器
舊版 CLSID 7EFD3C7E-9E4B-4a93-9503-DECD74C0AC6D 483B0283-25DB-4c92-9C15-A65925CB95CE
舊版檔案名稱 NaturalLanguage6.dll NaturalLanguage6.dll
目前 CLSID 04b37e30-c9a9-4a7d-8f20-792fc87ddf71 None
目前檔案名稱 MSWB7.dll None

德文 (deu),LCID 1031

元件 斷詞工具 詞幹分析器
舊版 CLSID 45EACA36-DBE9-4e4a-A26D-5C201902346D 65170AE4-0AD2-4fa5-B3BA-7CD73E2DA825
舊版檔案名稱 NaturalLanguage6.dll NaturalLanguage6.dll
目前 CLSID dfa00c33-bf19-482e-a791-3c785b0149b4 8a474d89-6e2f-419c-8dd5-9b50edc8c787
目前檔案名稱 MSWB7.dll MSWB7.dll

日文 (jpn),LCID 1041

元件 斷詞工具 詞幹分析器
舊版 CLSID E1E8F15E-8BEC-45df-83BF-50FF84D0CAB5 3D5DF14F-649F-4cbc-853D-F18FEDE9CF5D
舊版檔案名稱 NaturalLanguage6.dll NaturalLanguage6.dll
目前 CLSID 04096682-6ece-4e9e-90c1-52d81f0422ed None
目前檔案名稱 MsWb70011.dll None

荷蘭文 (nld),LCID 1043

元件 斷詞工具 詞幹分析器
舊版 CLSID 2C9F6BEB-C5B0-42b6-A5EE-84C24DC0D8EF F7A465EE-13FB-409a-B878-195B420433AF
舊版檔案名稱 NaturalLanguage6.dll NaturalLanguage6.dll
目前 CLSID 69483c30-a9af-4552-8f84-a0796ad5285b CF923CB5-1187-43ab-B053-3E44BED65FFA
目前檔案名稱 MSWB7.dll MSWB7.dll

俄文 (rus),LCID 1049

元件 斷詞工具 詞幹分析器
舊版 CLSID 2CB6CDA4-1C14-4392-A8EC-81EEF1F2E079 E06A0DDD-E81A-4e93-8A8D-F386C3A1B670
舊版檔案名稱 NaturalLanguage6.dll NaturalLanguage6.dll
目前 CLSID aaa3d3bd-6de7-4317-91a0-d25e7d3babc3 d42c8b70-adeb-4b81-a52f-c09f24f77dfa
目前檔案名稱 MSWB7.dll MSWB7.dll

舊版或目前檔案名稱都不是 NaturalLanguage6.dll 的語言

在下表中的語言,舊版斷詞工具和字幹分析器的檔案名稱不同於新版檔案名稱。 舊版或目前檔案名稱都不是 NaturalLanguage6.dll。 您不必取代任何檔案,因為 SQL Server 安裝程式會將目前版本和舊版元件都複製到 Binn 資料夾中。 不過,您必須變更一組登錄項目,以指定舊版或目前版本的元件。

受影響語言的清單

語言 縮寫
用於
登記簿
LCID
簡體中文 chs 2052
繁體中文 cht 1028
泰文 tha 1054
繁體中文 zh-hk 3076
繁體中文 zh-mo 5124
簡體中文 zh-sg 4100

上表按縮寫欄的字母順序排序。

將以下指示與還原和恢復斷詞工具與字幹分析器的檔案名稱和登錄值一節中的值列表一起使用。

若要還原為舊版元件

  1. 不要從 Binn 資料夾中移除目前元件版本的檔案。

  2. 在登錄中,瀏覽至下列節點:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID

  3. 使用下列步驟,針對選定語言的舊版斷詞工具和字幹分析器介面加入 COM ClassID 的新機碼:

    1. 新增一個鍵,並使用表格中前一個斷詞工具的值。

    2. 將該鍵值的 (預設值) 資料更新為表格中先前斷詞工具的檔案名稱。

    3. 如果選擇的語言使用字幹分析器,則從表格中加入一個帶有前一個字幹分析器值的新鍵。

    4. 如果選取的語言使用字幹分析器,則將該機碼值的 (預設值) 資料更新為表格中舊版字幹分析器的檔案名稱。

  4. 在登錄中,瀏覽至下列節點HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key> <language_key> 代表登錄中所用語言的縮寫,例如「fra」代表法文,「esn」則代表西班牙文。

  5. WBreakerClass 鍵值更新為表格中目前斷詞工具的值。

  6. 如果所選的語言使用字幹分析器,請將 StemmerClass 鍵值更新為表格中當前字幹分析器的值。

  7. 重新啟動 SQL Server。

若要還原先前的元件

  1. 不要從 Binn 資料夾中移除舊版元件的檔案。

  2. 在登錄中,瀏覽至下列節點:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID

  3. 如果下列機碼不存在,則請使用以下步驟為當前選定語言的斷詞器和字幹分析器介面新增COM ClassID的新機碼:

    1. 新增一個機碼,並從表格中為目前的斷詞器取值。

    2. 將該機碼值的 (預設值) 資料更新為表格中目前斷詞工具的檔案名稱。

    3. 如果選取的語言使用字幹分析器,則添加一個新的鍵,其值取自表格中的當前字幹分析器。

    4. 如果選取的語言使用字幹分析器,則將該機碼值的 (預設值) 資料更新為表格中目前字幹分析器的檔案名稱。

  4. 在登錄中,瀏覽至下列節點HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key> <language_key> 代表登錄中所用語言的縮寫,例如「fra」代表法文,「esn」則代表西班牙文。

  5. WBreakerClass 機碼值更新為表格中前一個斷詞工具的值。

  6. 如果選取的語言使用字幹分析器,則將 StemmerClass 鍵值更新為表格中先前使用的字幹分析器的值。

  7. 重新啟動 SQL Server。

用於恢復分詞器和詞幹提取器的檔案名稱和登錄值

將下列的檔案名稱和登錄項目清單與上一節中的指示一起使用。 使用舊版值還原為舊版,或使用目前值還原目前版本的元件。

下列清單依各語言縮寫的字母順序排序。

簡體中文 (chs),LCID 2052

元件 斷詞工具
舊版 CLSID 12CE94A0-DEFB-11D2-B31D-00600893A857
舊版檔案名稱 chsbrkr.dll
目前 CLSID E0831C90-BAB0-4ca5-B9BD-EA254B538DAC
目前檔案名稱 MsWb70804.dll

繁體中文 (cht),LCID 1028

元件 斷詞工具
舊版 CLSID 1680E7C3-9430-4A51-9B82-1E7E7AEE5258
舊版檔案名稱 chtbrkr.dll
目前 CLSID E9B1DF65-08F1-438b-8277-EF462B23A792
目前檔案名稱 MsWb70404.dll

泰文 (tha),LCID 1054

元件 斷詞工具 詞幹分析器
舊版 CLSID CCA22CF4-59FE-11D1-BBFF-00C04FB97FDA CEDC01C7-59FE-11D1-BBFF-00C04FB97FDA
舊版檔案名稱 Thawbrkr.dll Thawbrkr.dll
目前 CLSID F70C0935-6E9F-4ef1-9F06-7876536DB900 None
目前檔案名稱 MsWb7001e.dll

繁體中文 (zh-hk),LCID 3076

元件 斷詞工具
舊版 CLSID 1680E7C3-9430-4A51-9B82-1E7E7AEE5258
舊版檔案名稱 chtbrkr.dll
目前 CLSID E9B1DF65-08F1-438b-8277-EF462B23A792
目前檔案名稱 MsWb70404.dll

繁體中文 (zh-mo),LCID 5124

元件 斷詞工具
舊版 CLSID 1680E7C3-9430-4A51-9B82-1E7E7AEE5258
舊版檔案名稱 chtbrkr.dll
目前 CLSID E9B1DF65-08F1-438b-8277-EF462B23A792
目前檔案名稱 MsWb70404.dll

簡體中文 (zh-sg),LCID 4100

元件 斷詞工具
舊版 CLSID 12CE94A0-DEFB-11D2-B31D-00600893A857
舊版檔案名稱 chsbrkr.dll
目前 CLSID E0831C90-BAB0-4ca5-B9BD-EA254B538DAC
目前檔案名稱 MsWb70804.dll

另請參閱

變更用於美式英文與英式英文的斷詞工具
全文檢索搜尋的行為變更