Sdílet prostřednictvím


Vrátit oddělovače slov používané vyhledáváním na předchozí verzi (SQL Server Search)

platí pro:SQL Serverazure SQL Database

SQL Server nainstaluje a povolí verzi modulů pro dělení slov a odvozování tvarů slov pro všechny jazyky podporované službou Full-Text Search s výjimkou korejštiny. Tento článek popisuje, jak přepnout z této verze těchto komponent na předchozí verzi nebo přepnout zpět z předchozí verze na novou verzi.

Tento článek se nezabírá následujícími jazyky:

  • anglické. Pokud chcete vrátit nebo obnovit anglické komponenty, přečtěte si téma Změna systému pro zpracování slov používaného v americké a britské angličtině.

  • Dánština, Polština a Turečtina. Nástroje pro dělení slov třetích stran pro dánštinu, polštinu a turečtinu, které byly součástí předchozích verzí SQL Serveru, byly nahrazeny komponentami Microsoftu.

  • české a řecké. Jsou k dispozici nové dělitele slov pro češtinu a řečtinu. Předchozí verze SYSTÉMU SQL Server Full-Text Search nezahrnují podporu těchto dvou jazyků.

  • korejských. V této verzi nejsou upgradovány komponenty rozkladače slov a stemmeru pro korejský jazyk.

Obecné informace o dělení slov a lematizátorech naleznete v tématu Konfigurace a správa děličů slov a lematizátorů pro vyhledávání.

Přehled vrácení a obnovení rozdělovačů slov a stemmerů

Pokyny pro vrácení a obnovení dělení slov a stemmerů závisí na jazyce. Následující tabulka shrnuje tři sady akcí, které mohou být nutné k návratu k předchozí verzi komponent.

Aktuální soubor Předchozí soubor Počet ovlivněných jazyků Akce pro soubory Akce pro položky registru
NaturalLanguage6.dll NaturalLanguage6.dll 34 Získejte a nainstalujte předchozí verzi NaturalLanguage6.dll, přepsáním aktuální verze souboru. Nevyžaduje se žádná akce.

Klíče a hodnoty registru se pro tuto verzi nezměnily.
(Jiný název souboru) NaturalLanguage6.dll 5 Získejte a nainstalujte předchozí verzi NaturalLanguage6.dll, abyste přepsali aktuální verzi souboru. Změňte sadu položek registru a určete předchozí verzi součástí.
(Jiný název souboru) (Jiný název souboru) 6 Nevyžaduje se žádná akce.

Instalační program SQL Serveru zkopíruje aktuální i předchozí verze komponent do složky Binn.
Změňte sadu položek registru a určete předchozí verzi součástí.

Varování

Pokud nahradíte aktuální verzi souboru NaturalLanguage6.dll jinou verzí, bude ovlivněno chování všech jazyků, které tento soubor používají.

Soubory popsané v tomto článku jsou soubory DLL, které jsou nainstalovány ve složce MSSQL\Binn instance SYSTÉMU SQL Server. Úplná cesta je obvykle následující:

C:\Program Files\Microsoft SQL Server\<instance>\MSSQL\Binn

Jazyky, pro které je název souboru systému pro dělení slov, a to jak aktuálního, tak předchozího, NaturalLanguage6.dll

Pro jazyky v následující tabulce je pro aktuální i předchozí mechanismus dělení slov použit název souboru NaturalLanguage6.dll. Pokud chcete tyto komponenty vrátit nebo obnovit, musíte přepsat NaturalLanguage6.dll jinou verzí stejného souboru. Není nutné měnit žádné položky registru, protože položky registru se pro tuto verzi nezměnily.

Varování

Pokud nahradíte aktuální verzi souboru NaturalLanguage6.dll jinou verzí, bude ovlivněno chování všech jazyků, které tento soubor používají.

Seznam ovlivněných jazyků

Jazyk Zkratka
používané v
registr
LCID
Bengálština ben 1093
Bulharština bgr 1026
Katalánština cat 1027
Španělština esn 3082
Francouzština fra 1036
Gudžarátština guj 1095
Hebrejština heb 1037
Hindština hin 1081
Chorvatština hrv 1050
Indonéština ind 1057
Islandština isl 1039
Italština ita 1040
Kannadština kan 1099
Litevština lth 1063
Lotyština lvi 1062
Malajalámština mal 1100
Maráthština mar 1102
Malajština msl 1086
Neutrální Neutral 0000
Norwegial Bokmaal nor 1044
Paňdžábština pan 1094
Portugalština (Brazílie) ptb 1046
Portugalština ptg 2070
Rumunština rom 1048
Slovenština sky 1051
Slovinština slv 1060
Srbština – cyrilice srb 3098
Srbština – latinka srl 2074
Švédština sve 1053
Tamilština tam 1097
Telugština tel 1098
Ukrajinština ukr 1058
Urdština urd 1056
Vietnamština vit 1066

Předchozí tabulka je seřazená abecedně podle sloupce Zkratka.

Návrat k předchozím komponentám

  1. Přejděte do složky Binn popsané výše.

  2. Zálohujte verzi SYSTÉMU SQL Server NaturalLanguage6.dll do jiného umístění.

  3. Zkopírujte předchozí verzi NaturalLanguage6.dll ze složky Binn instance SYSTÉMU SQL Server 2008 R2 (10.50.x) nebo SQL Server 2008 (10.0.x) do složky Binn instance SQL Serveru.

    Varování

    Tato změna má vliv na všechny jazyky, které používají NaturalLanguage6.dll v aktuální i předchozí verzi.

  4. Restartujte SQL Server.

Obnovit aktuální součásti

  1. Přejděte do umístění, kam jste zálohovali verzi SQL Serveru NaturalLanguage6.dll.

  2. Zkopírujte aktuální verzi NaturalLanguage6.dll z umístění zálohy do složky Binn instance SQL Serveru.

    Varování

    Tato změna má vliv na všechny jazyky, které používají NaturalLanguage6.dll v aktuální i předchozí verzi.

  3. Restartujte SQL Server.

Jazyky, pro které je název souboru předchozího oddělovače slov pouze NaturalLanguage6.dll

Pro jazyky v následující tabulce se název souboru předchozího dělení slov liší od názvu souboru nové verze. Předchozí název souboru je NaturalLanguage6.dll. Pokud se chcete vrátit k předchozí verzi, musíte přepsat aktuální verzi NaturalLanguage6.dll starší verzí stejného souboru. Musíte také změnit sadu položek registru, abyste určili předchozí nebo aktuální verzi komponent.

Varování

Pokud nahradíte aktuální verzi souboru NaturalLanguage6.dll jinou verzí, bude ovlivněno chování všech jazyků, které tento soubor používají.

Seznam ovlivněných jazyků

Jazyk Zkratka
použité v
registr
LCID
Arabština ara 1025
Němčina deu 1031
Japonština jpn 1041
Holandština nld 1043
Ruština Rus 1049

Předchozí tabulka je seřazená abecedně podle sloupce Zkratka.

Následující pokyny použijte společně se seznamem hodnot v části Názvy souborů a hodnoty registru pro reset a obnovení děličů slov a tvořičů tvarů.

Návrat k předchozím komponentám

  1. Přejděte do složky Binn popsané výše.

  2. Neodstraňujte soubory pro aktuální verzi komponentů ze složky Binn.

  3. Zálohujte verzi SYSTÉMU SQL Server NaturalLanguage6.dll do jiného umístění.

  4. Zkopírujte předchozí verzi NaturalLanguage6.dll ze složky Binn instance systému SQL Server 2008 R2 (10.50.x) nebo SQL Server 2008 (10.0.x) do složky Binn nové instance SQL Serveru.

    Varování

    Tato změna má vliv na všechny jazyky, které používají NaturalLanguage6.dll v aktuální i předchozí verzi.

  5. V registru přejděte na následující uzel: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID.

  6. Pomocí následujícího postupu přidejte nové klíče pro identifikátory COM ClassID pro předchozí dělení slov a rozhraní stemmeru pro vybraný jazyk:

    1. Přidejte nový klíč s hodnotou z tabulky pro předchozí modul pro dělení slov.

    2. Aktualizujte (výchozí) data této hodnoty klíče na název souboru předchozího dělení slov z tabulky.

    3. Pokud vybraný jazyk používá stemmer, přidejte nový klíč s hodnotou z tabulky pro předchozí stemmer.

    4. Pokud vybraný jazyk používá stemmer, aktualizujte data tohoto klíče (Výchozí) na název souboru předchozího stemmeru z tabulky.

  7. V registru přejděte na následující uzel: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key>. <language_key> představuje zkratku jazyka používaného v rejstříku; například "fra" pro francouzštinu a "esn" pro španělštinu.

  8. Aktualizujte hodnotu klíče WBreakerClass na hodnotu z tabulky pro aktuální dělení slov.

  9. Pokud vybraný jazyk používá stemmer, aktualizujte hodnotu klíče StemmerClass na hodnotu z tabulky pro aktuálně používaný stemmer.

  10. Restartujte SQL Server.

Obnovit aktuální součásti

  1. Přejděte do umístění, kam jste zálohovali verzi SQL serveru NaturalLanguage6.dll.

  2. Zkopírujte aktuální verzi NaturalLanguage6.dll ze záložního umístění do složky Binn v instanci SQL Serveru.

    Varování

    Tato změna má vliv na všechny jazyky, které používají NaturalLanguage6.dll v aktuální i předchozí verzi.

  3. V registru přejděte na následující uzel: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID.

  4. Pokud tyto klíče neexistují, použijte následující postup k přidání nových klíčů pro identifikátory tříd COM pro aktuální rozhraní děliče slov a stemmeru pro vybraný jazyk:

    1. Přidejte nový klíč s hodnotou z tabulky pro aktuální dělení slov.

    2. Aktualizujte (výchozí) data této hodnoty klíče na název souboru aktuálního dělení slov z tabulky.

    3. Pokud vybraný jazyk používá stemmer, přidejte nový klíč s hodnotou z tabulky pro aktuální stemmer.

    4. Pokud vybraný jazyk používá stemmer, aktualizujte (výchozí) data u tohoto klíče na název souboru aktuálně používaného stemmeru uvedeného v tabulce.

  5. V registru přejděte na následující uzel: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key>. <language_key> představuje zkratku jazyka používaného v rejstříku; například "fra" pro francouzštinu a "esn" pro španělštinu.

  6. Aktualizujte hodnotu klíče WBreakerClass na hodnotu z tabulky pro předchozí dělení slov.

  7. Pokud vybraný jazyk používá stemmer, aktualizujte hodnotu klíče StemmerClass na hodnotu uvedenou v tabulce pro předcházející stemmer.

  8. Restartujte SQL Server.

Názvy souborů a hodnoty registru pro navrácení a obnovení děličů slov a stemmatizátorů

Použijte následující seznam názvů souborů a položek registru společně s pokyny v předchozí části. Pomocí předchozích hodnot se vraťte k předchozí verzi nebo použijte aktuální hodnoty k obnovení aktuální verze součástí.

Následující seznam je seřazen abecedně podle zkratky používané pro každý jazyk.

arabština (ara), LCID 1025

Komponenta Dělič slov Stemmer
Předchozí CLSID 7EFD3C7E-9E4B-4a93-9503-DECD74C0AC6D 483B0283-25DB-4c92-9C15-A65925CB95CE
Předchozí název souboru NaturalLanguage6.dll NaturalLanguage6.dll
Aktuální CLSID 04b37e30-c9a9-4a7d-8f20-792fc87ddf71 Žádný
Aktuální název souboru MSWB7.dll Žádný

němčina (deu), LCID 1031

Komponenta Dělič slov Nástroj pro stemming
Předchozí CLSID 45EACA36-DBE9-4e4a-A26D-5C201902346D 65170AE4-0AD2-4fa5-B3BA-7CD73E2DA825
Předchozí název souboru NaturalLanguage6.dll NaturalLanguage6.dll
Aktuální CLSID dfa00c33-bf19-482e-a791-3c785b0149b4 8a474d89-6e2f-419c-8dd5-9b50edc8c787
Aktuální název souboru MsWb7.dll MsWb7.dll

japonština (jpn), LCID 1041

Komponenta Rozdělovník slov Stemming
Předchozí CLSID E1E8F15E-8BEC-45df-83BF-50FF84D0CAB5 3D5DF14F-649F-4cbc-853D-F18FEDE9CF5D
Předchozí název souboru NaturalLanguage6.dll NaturalLanguage6.dll
Aktuální CLSID 04096682-6ece-4e9e-90c1-52d81f0422ed Žádný
Aktuální název souboru MsWb70011.dll Žádný

nizozemština (nld), LCID 1043

Komponenta rozčleňovač slov Stemmer
Předchozí CLSID 2C9F6BEB-C5B0-42b6-A5EE-84C24DC0D8EF F7A465EE-13FB-409a-B878-195B420433AF
Předchozí název souboru NaturalLanguage6.dll NaturalLanguage6.dll
Aktuální CLSID 69483c30-a9af-4552-8f84-a0796ad5285b CF923CB5-1187-43ab-B053-3E44BED65FFA
Aktuální název souboru MsWb7.dll MsWb7.dll

ruština (rus), LCID 1049

Komponenta Dělitel slov stemmingový algoritmus
Předchozí CLSID 2CB6CDA4-1C14-4392-A8EC-81EEF1F2E079 E06A0DDD-E81A-4e93-8A8D-F386C3A1B670
Předchozí název souboru NaturalLanguage6.dll NaturalLanguage6.dll
Aktuální CLSID aaa3d3bd-6de7-4317-91a0-d25e7d3babc3 d42c8b70-adeb-4b81-a52f-c09f24f77dfa
Aktuální název souboru MsWb7.dll MsWb7.dll

Jazyky, pro které není NaturalLanguage6.dll předchozí ani aktuální název souboru

U jazyků v následující tabulce se názvy souborů předchozích rozlišovačů slov a stemmerů liší od názvů souborů nových verzí souborů. Předchozí ani aktuální název souboru není NaturalLanguage6.dll. Nemusíte nahrazovat žádné soubory, protože instalační program SQL Serveru kopíruje aktuální i předchozí verze komponent do složky Binn. Musíte ale změnit sadu položek registru, abyste určili předchozí nebo aktuální verzi součástí.

Seznam ovlivněných jazyků

Jazyk Zkratka
použité v
registr
LCID
Zjednodušená čínština chs 2052
Tradiční čínština cht 1028
Thajština Tha 1054
Tradiční čínština zh-hk 3076
Tradiční čínština zh-mo 5124
Zjednodušená čínština zh-sg 4100

Předchozí tabulka je seřazená abecedně podle sloupce Zkratka.

Následující pokyny použijte společně se seznamem hodnot v části Názvy souborů a hodnoty registru pro vrácení a obnovení děličů a kmenujících algoritmů.

Návrat k předchozím komponentám

  1. Neodstraňujte soubory pro aktuální verzi součástí ze složky Binn.

  2. V registru přejděte na následující uzel: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID.

  3. Pomocí následujícího postupu přidejte nové klíče pro identifikátory COM ClassID pro předchozí dělení slov a rozhraní stemmeru pro vybraný jazyk:

    1. Přidejte nový klíč s hodnotou z tabulky, která souvisí s předchozím dělením slov.

    2. Aktualizujte data výchozí hodnoty tohoto klíče na název souboru předchozího dělení slov z tabulky.

    3. Pokud vybraný jazyk používá stemmer, přidejte nový klíč s hodnotou z tabulky odpovídající předchozímu stemmeru.

    4. Pokud vybraný jazyk používá stemmer, aktualizujte data tohoto klíče (Výchozí) na název souboru předchozího stemmeru z tabulky.

  4. V registru přejděte na následující uzel: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key>. <language_key> představuje zkratku jazyka používaného v rejstříku; například "fra" pro francouzštinu a "esn" pro španělštinu.

  5. Aktualizujte hodnotu klíče WBreakerClass na hodnotu z tabulky pro aktuální dělení slov.

  6. Pokud vybraný jazyk používá stemmer, aktualizujte hodnotu klíče StemmerClass na hodnotu z tabulky pro aktuální stemmer.

  7. Restartujte SQL Server.

Obnovení předchozích součástí

  1. Neodstraňujte soubory pro předchozí verzi komponent ze složky Binn.

  2. V registru přejděte na následující uzel: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID.

  3. Pokud tyto klíče neexistují, pomocí následujícího postupu přidejte nové klíče pro identifikátory tříd COM pro aktuální rozhraní pro dělení slov a stemmer pro vybraný jazyk:

    1. Přidejte nový klíč s hodnotou z tabulky pro aktuální oddělovač slov.

    2. Aktualizujte (výchozí) data této klíčové hodnoty na název souboru aktuálního oddělovače slov z tabulky.

    3. Pokud vybraný jazyk používá stemmer, přidejte nový klíč s hodnotou z tabulky pro aktuální stemmer.

    4. Pokud vybraný jazyk používá stemmer, aktualizujte výchozí data tohoto klíče na název souboru aktuálního stemmeru z tabulky.

  4. V registru přejděte na následující uzel: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key>. <language_key> představuje zkratku jazyka používaného v rejstříku; například "fra" pro francouzštinu a "esn" pro španělštinu.

  5. Aktualizujte hodnotu klíče WBreakerClass na hodnotu z tabulky pro předchozí dělení slov.

  6. Pokud vybraný jazyk používá stemmer, pak aktualizujte hodnotu klíče StemmerClass na hodnotu z tabulky pro předchozí stemmer.

  7. Restartujte SQL Server.

Názvy souborů a hodnoty registru pro vrácení a obnovení členění slov a algoritmů stemmatizace

Použijte následující seznam názvů souborů a položek registru společně s pokyny v předchozí části. Pomocí předchozích hodnot se vraťte k předchozí verzi nebo použijte aktuální hodnoty k obnovení aktuální verze součástí.

Následující seznam je seřazen abecedně podle zkratky používané pro každý jazyk.

Zjednodušená čínština (CHS), LCID 2052

Komponenta Dělitel slov
Předchozí CLSID 12CE94A0-DEFB-11D2-B31D-00600893A857
Předchozí název souboru chsbrkr.dll
Aktuální CLSID E0831C90-BAB0-4ca5-B9BD-EA254B538DAC
Aktuální název souboru MsWb70804.dll

tradiční čínština (cht), LCID 1028

Komponenta Dělitel slov
Předchozí CLSID 1680E7C3-9430-4A51-9B82-1E7E7AEE5258
Předchozí název souboru chtbrkr.dll
Aktuální CLSID E9B1DF65-08F1-438b-8277-EF462B23A792
Aktuální název souboru MsWb70404.dll

thajština (tha), LCID 1054

Komponenta Dělitel slov Stemmer
Předchozí CLSID CCA22CF4-59FE-11D1-BBFF-00C04FB97FDA CEDC01C7-59FE-11D1-BBFF-00C04FB97FDA
Předchozí název souboru Thawbrkr.dll Thawbrkr.dll
Aktuální CLSID F70C0935-6E9F-4ef1-9F06-7876536DB900 Žádný
Aktuální název souboru MsWb7001e.dll Žádný

tradiční čínština (zh-hk), LCID 3076

Komponenta Dělitel slov
Předchozí CLSID 1680E7C3-9430-4A51-9B82-1E7E7AEE5258
Předchozí název souboru chtbrkr.dll
Aktuální CLSID E9B1DF65-08F1-438b-8277-EF462B23A792
Aktuální název souboru MsWb70404.dll

tradiční čínština (zh-mo), LCID 5124

Komponenta Dělitel slov
Předchozí CLSID 1680E7C3-9430-4A51-9B82-1E7E7AEE5258
Předchozí název souboru chtbrkr.dll
Aktuální CLSID E9B1DF65-08F1-438b-8277-EF462B23A792
Aktuální název souboru MsWb70404.dll

zjednodušená čínština (zh-sg), LCID 4100

Komponenta Dělitel slov
Předchozí CLSID 12CE94A0-DEFB-11D2-B31D-00600893A857
Předchozí název souboru chsbrkr.dll
Aktuální CLSID E0831C90-BAB0-4ca5-B9BD-EA254B538DAC
Aktuální název souboru MsWb70804.dll

Viz také

Změna děliče slov používaného pro americkou a britskou angličtinu
změny chování k vyhledávání Full-Text