如何:載入授權協力廠商斷詞工具
SQL Server 2008 包括下列語言的授權協力廠商斷詞工具:
丹麥文
波蘭文
土耳其文
雖然有這些斷詞工具可供使用,但預設並未安裝,而且您必須手動登錄,然後加入至支援全文檢索索引和查詢的 LCID 清單。
必要條件資訊
您需要下列資訊,然後才能載入斷詞工具:
想要在其上註冊斷詞工具之每個 SQL Server 執行個體的執行個體名稱。
每個執行個體的 FTDATA 路徑。
取得執行個體識別碼之後,您必須擷取 FTData 資料夾的適當執行個體特定路徑。加入用來指定某個語言之詞素和同義字檔案的組態值時,將會使用這個路徑。
若要取得 SQL Server 執行個體的執行個體識別碼
按一下 [開始],並按一下 [執行]。
在 [執行] 對話方塊的 [開啟] 方塊中,輸入 Regedit。
按一下 [確定]。[登錄編輯器] 隨即開啟。
導覽至 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\Instance Names\SQL。該處的右側窗格中會在 [資料] 資料行中顯示每個已安裝之 SQL Server 執行個體的執行個體名稱與執行個體識別碼。取得您要載入協力廠商斷詞工具之每個伺服器執行個體的執行個體識別碼。
若要取得每個執行個體的 FTData 路徑
按一下 [開始],並按一下 [執行]。
在 [執行] 對話方塊的 [開啟] 方塊中,輸入 Regedit。
按一下 [確定]。
在 [登錄編輯器] 中,選取 SQL Server 執行個體的下列登錄機碼:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\instance_ID\MSSQLServer,其中 instance_ID 是您要載入斷詞工具之伺服器執行個體的識別碼。例如,對於預設伺服器執行個體,登錄機碼值為:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\Setup
右窗格會顯示 FullTextDefaultPath 值,其包含 FTData 資料夾的執行個體特定路徑。例如,對於 SQL Server 2008 的預設執行個體,路徑為:
C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\FTData
註冊斷詞工具和相關的語言元件
Microsoft 所授權之協力廠商斷詞工具的安裝程序共有三個階段。下列清單摘要列出這些階段,這些階段的步驟將於本節稍後加以說明。
將正在註冊之語言的斷詞工具和字幹分析器介面的 COM 類別識別碼,當成機碼加入至登錄的 <InstanceRoot>\MSSearch\CLSID 節點。
將機碼加入至該語言的 <InstanceRoot>\MSSearch\Language 節點。
加入組態值,用以指定該語言之詞素和同義字檔案的位置。
[!附註]
丹麥文斷詞工具將當做本節的範例。安裝每一種語言之斷詞工具所需的值會在本主題稍後的表格中提供。
階段 1:針對正在註冊的語言,加入其斷詞工具和字幹分析器介面的 COM 類別識別碼
警告 |
---|
不當編輯登錄可能會造成系統嚴重受損。在變更登錄之前,應備份電腦上的所有重要資料。 |
若要加入丹麥文語言之這些元件的 COM 類別識別碼**:**
開啟 [登錄編輯器],方法是:
按一下 [開始],並按一下 [執行]。
在 [執行] 對話方塊的 [開啟] 方塊中,輸入 Regedit。
在 [登錄編輯器] 中,選取 SQL Server 執行個體的下列登錄機碼:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\CLSID
在功能表列中,依序按一下 [編輯]、[新增] 及 [機碼]。
輸入 {16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D}。
按 ENTER 鍵。
在右窗格中,用滑鼠右鍵按一下 [預設值] 登錄值,然後按一下 [修改]。
在 [編輯字串] 對話方塊的 [值資料] 方塊中,輸入 danlr.dll,然後按一下 [確定]。
重複步驟 3 到 7,將步驟 4 中的值取代為 {83BC7EF7-D27B-4950-A743-0F8E5CA928F8}。
若為給定的語言,請遵循以上步驟,將步驟 4 和 8 中的機碼值取代為您想要的語言機碼值。下面會列出這些值。在步驟 7 中,請將 danlr.dll 取代為您想要的語言 .dll 名稱。
語言 |
步驟 4 的機碼值 |
步驟 7 的 .DLL 名稱 |
步驟 8 的機碼值 |
---|---|---|---|
丹麥文 |
{16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D} |
danlr.dll |
{83BC7EF7-D27B-4950-A743-0F8E5CA928F8} |
波蘭文 |
{B8713269-2D9D-4BF5-BF40-2615D75723D8} |
lrpolish.dll |
{CA665B09-4642-4C84-A9B7-9B8F3CD7C3F6} |
土耳其文 |
{23A9C1C3-3C7A-4D2C-B894-4F286459DAD6} |
trklr.dll |
{8DF412D1-62C7-4667-BBEC-38756576C21B} |
階段 2:將機碼加入至該語言的 <InstanceRoot>\MSSearch\Language 節點
若要將機碼加入至丹麥文語言的這個節點:
選取預設 SQL Server 執行個體的下列登錄機碼:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language
重複前個程序中的步驟 3 到 5,將步驟 4 中的機碼名稱取代為 dan。
若為給定的語言,請遵循以上步驟,將步驟 4 中的機碼名稱取代為下面針對特定語言所列出的值。
語言 |
步驟 4 的機碼名稱 |
---|---|
丹麥文 |
dan |
波蘭文 |
plk |
土耳其文 |
trk |
步驟 3:加入組態值,以便提供某種語言之每個語言元件的位置
若要加入丹麥文語言之這些元件的組態值:
選取您在上述階段 2 中所輸入的登錄機碼。對於 SQL Server 的預設執行個體,這是:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\dan
在功能表列中,依序按一下 [編輯]、[新增] 及 [字串值]。
輸入 TsaurusFile。
按 ENTER 鍵。
以滑鼠右鍵按一下您剛剛加入的 TsaurusFile 登錄值,然後按一下 [修改]。
在 [編輯字串] 對話方塊的 [值資料] 方塊中,輸入 tsdan.xml。
按一下 [確定]。
針對該語言的其餘語言元件 (同義字檔案、語言 (地區設定)、斷詞工具和字幹分析器),重複步驟 2 到 7。下面將提供針對丹麥文、波蘭文或土耳其文語言註冊這些元件的值。
丹麥文的值
重複步驟 2 到 7 以加入下面所列出的每一組值,並取代每個值的語言特有值類型 (步驟 2)、值名稱 (步驟 3 和 5) 及值資料 (步驟 6)。
步驟 2 的值類型 |
步驟 3 和 5 的值名稱 |
步驟 6 的值類型 |
---|---|---|
字串值 |
TsaurusFile |
tsdan.xml |
DWORD 值 |
地區設定 |
00000406 |
字串值 |
WBreakerClass |
{16BC5CE4-2C78-4CB9-80D5-386A68CC2B2D} |
字串值 |
StemmerClass |
{83BC7EF7-D27B-4950-A743-0F8E5CA928F8} |
波蘭文的值
若為波蘭文語言,請遵循以上所述的步驟,並使用下面所列出的值。選取您在上述階段 2 中針對波蘭文所輸入的登錄機碼。對於 SQL Server 的預設執行個體,這是:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\plk
完成步驟 2 到 7 以加入下面所列出的每一組值,並取代每個值的語言特有值類型 (步驟 2)、值名稱 (步驟 3 和 5) 及值資料 (步驟 6)。
步驟 2 的值類型 |
步驟 3 和 5 的值名稱 |
步驟 6 的值資料 |
---|---|---|
字串值 |
TsaurusFile |
tsplk.xml |
DWORD 值 |
地區設定 |
00000415 |
字串值 |
WBreakerClass |
{CA665B09-4642-4C84-A9B7-9B8F3CD7C3F6} |
字串值 |
StemmerClass |
{B8713269-2D9D-4BF5-BF40-2615D75723D8} |
土耳其文的值
若為土耳其文語言,請遵循以上所述的步驟,並使用下面所列出的值。選取您在上述階段 2 中針對土耳其文所輸入的登錄機碼。對於 SQL Server 的預設執行個體,這是:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSearch\Language\trk
完成步驟 2 到 7 以加入下面所列出的每一組值,並取代每個值的語言特有值類型 (步驟 2)、值名稱 (步驟 3 和 5) 及值資料 (步驟 6)。
步驟 2 的值類型 |
步驟 3 和 5 的值名稱 |
步驟 6 的值資料 |
---|---|---|
字串值 |
TsaurusFile |
tstrk.xml |
DWORD 值 |
地區設定 |
0000041f |
字串值 |
WBreakerClass |
{8DF412D1-62C7-4667-BBEC-38756576C21B} |
字串值 |
StemmerClass |
{23A9C1C3-3C7A-4D2C-B894-4F286459DAD6} |
更新全文檢索搜尋所支援的語言清單
載入協力廠商斷詞工具之後,您必須重新整理支援全文檢索索引和查詢的 LCID 清單。若要重新整理此清單,使用 sp_fulltext_service 系統預存程序來更新語言的清單,如下所示:
exec sp_fulltext_service 'update_languages';
sys.fulltext_languages 目錄檢視現在將會列出新載入之斷詞工具的語言。