Поделиться через


Вернуть разделители слов, используемые поиском, на предыдущую версию (поиск SQL Server)

Область применения: SQL Server База данных SQL Azure

SQL Server устанавливает и включает версию средств разбиения слов и стеммеров для всех языков, поддерживаемых системой полнотекстового поиска, за исключением корейского языка. В этой статье описывается способ переключения из данной версии этих компонентов в предыдущую версию или обратно из предыдущей версии в новую версию.

В этой статье не обсуждаются следующие языки:

  • Английский. Способ возврата к использованию или восстановления компонентов английского языка см. в разделе Изменение средства разбиения по словам, используемого для английского (США) и английского (Британского).

  • Датский, польский и турецкий. Сторонние средства разбиения слов для датских, польских и турецких, которые были включены в предыдущие выпуски SQL Server, были заменены компонентами Майкрософт.

  • Чешский и греческий. Добавлены средства разбиения по словам для чешского и греческого языков. Предыдущие выпуски полнотекстового поиска SQL Server не включали поддержку этих двух языков.

  • Корейский. Средство разбиения по словам и стеммер для корейского языка в этой версии не обновлены.

Общую информацию о разделителях слов и стеммерах см. в статье Настройка и управление разделителями слов и стеммерами для поиска.

Общие сведения о возврате к использованию и восстановлении средств разбиения по словам и парадигматических модулей

Инструкции по возврату к использованию и восстановлению средств разбиения по словам и парадигматических модулей зависят от языка. В приведенной ниже таблице обобщены три набора действий, выполнение которых может потребоваться для возврата к предыдущей версии компонентов.

Текущий файл Предыдущий файл Число затронутых языков Действия для файлов Действия для записей реестра
NaturalLanguage6.dll NaturalLanguage6.dll 34 Получите и установите предыдущую версию файла NaturalLanguage6.dll, переписав ее поверх текущей версии файла. Действия не требуется.

Разделы реестра и значения для этого выпуска не изменились.
(Другое имя файла) NaturalLanguage6.dll 5 Получите и установите предыдущую версию файла NaturalLanguage6.dll, переписав ее поверх текущей версии файла. Измените набор записей реестра, указав в них предыдущую версию компонентов.
(Другое имя файла) (Другое имя файла) 6 Действия не требуется.

Программа установки SQL Server копирует текущие и предыдущие версии компонентов в папку Binn.
Измените набор записей реестра, указав в них предыдущую версию компонентов.

Предупреждение

Если заменить текущую версию файла NaturalLanguage6.dll на другую, это затронет все языки, использующие этот файл.

Файлы, описанные в этой статье, — это файлы DLL, установленные в папке MSSQL\Binn для экземпляра SQL Server. Полный путь обычно выглядит следующим образом:

C:\Program Files\Microsoft SQL Server\<instance>\MSSQL\Binn

Языки, у которых именем файла текущего и предыдущего средства разбиения по словам является NaturalLanguage6.dll

Для языков в следующей таблице именем файла текущего и предыдущего средства разбиения по словам является NaturalLanguage6.dll. Чтобы вернуться к использованию или восстановить данные компоненты, необходимо заменить файл NaturalLanguage6.dll другой версией этого файла. Записи реестра заменять не нужно, поскольку в этом выпуске они не изменялись.

Предупреждение

Если заменить текущую версию файла NaturalLanguage6.dll на другую, это затронет все языки, использующие этот файл.

Список затронутых языков

Язык Аббревиатура
применяется в
реестр
LCID
Бенгальский ben 1093
Болгарский bgr 1026
Каталанский cat 1027
Испанский esn 3082
Французский fra 1036
Гуджарати guj 1095
Иврит heb 1037
Хинди hin 1081
Хорватский hrv 1050
Индонезийский ind 1057
Исландский isl 1039
Итальянский ita 1040
Каннада kan 1099
Литовский lth 1063
Латышский lvi 1062
Малаялам mal 1 100
Маратхи mar 1102
Малайский msl 1086
Нейтральные Neutral 0000
Норвежский Букмол nor 1044
Панджаби pan 1094
португальский (Бразилия) ptb 1046
Португальский ptg 2070
Румынский rom 1048
Словацкий sky 1051
Словенский slv 1060
Сербский — кириллица srb 3098
Сербский — латиница srl 2074
Шведский sve 1053
Тамильский tam 1097
Телугу tel 1098
Украинский ukr 1058
Урду urd 1056
Вьетнамский vit 1066

Предыдущая таблица отсортирована в алфавитном порядке по столбцу «Аббревиатура».

Возврат к использованию предыдущих компонентов.

  1. Перейдите в папку Binn, описанную выше.

  2. Создайте резервную копию версии DLL NaturalLanguage6 для SQL Server в другое место.

  3. Скопируйте предыдущую версию NaturalLanguage6.dll из папки Binn экземпляра SQL Server 2008 R2 (10.50.x) или SQL Server 2008 (10.0.x) в папку Binn экземпляра SQL Server.

    Предупреждение

    Это изменение затрагивает все языки, использующие файл NaturalLanguage6.dll, в текущей и в предыдущей версии.

  4. Перезапуск SQL Server.

Восстановление текущих компонентов

  1. Перейдите в расположение, в котором вы создали резервную копию версии SQL Server NaturalLanguage6.dll.

  2. Скопируйте текущую версию NaturalLanguage6.dll из расположения резервной копии в папку Binn экземпляра SQL Server.

    Предупреждение

    Это изменение затрагивает все языки, использующие файл NaturalLanguage6.dll, в текущей и в предыдущей версии.

  3. Перезапуск SQL Server.

Языки, для которых названием файла предыдущего средства разбиения слов является исключительно NaturalLanguage6.dll.

Для языков в следующей таблице имя файла предыдущей версии средства разбиения по словам отличается от имени файла новой версии. Предыдущим именем файла является NaturalLanguage6.dll. Чтобы вернуться к использованию предыдущей версии, необходимо заменить текущую версию файла NaturalLanguage6.dll более ранней версией этого файла. Также необходимо изменить набор записей реестра, указав в них предыдущую или текущую версию компонентов.

Предупреждение

Если заменить текущую версию файла NaturalLanguage6.dll на другую, это затронет все языки, использующие этот файл.

Список затронутых языков

Язык Аббревиатура
применяется в
реестр
LCID
Арабский ara 1025
Немецкий deu 1031
Японский jpn 1041
Голландский нлд 1043
русский rus 1049

Предыдущая таблица отсортирована в алфавитном порядке по столбцу «Аббревиатура».

Используйте следующие инструкции совместно со списком значений в разделе Имена файлов и значения реестра для возврата к использованию и восстановления средств разбиения по словам и стеммеров.

Возврат к использованию предыдущих компонентов.

  1. Перейдите в папку Binn, описанную выше.

  2. Не удаляйте файлы текущей версии компонентов из папки Binn.

  3. Сделайте резервную копию файла NaturalLanguage6.dll версии SQL Server в другое расположение.

  4. Скопируйте предыдущую версию NaturalLanguage6.dll из папки Binn экземпляра SQL Server 2008 R2 (10.50.x) или SQL Server 2008 (10.0.x) в папку Binn нового экземпляра SQL Server.

    Предупреждение

    Это изменение затрагивает все языки, использующие файл NaturalLanguage6.dll, в текущей и в предыдущей версии.

  5. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID.

  6. Чтобы добавить новые ключи для идентификаторов классов COM для предыдущих интерфейсов средства разбиения по словам и стеммера для выбранного языка, выполните следующие действия.

    1. Добавьте новый ключ со значением из таблицы для предыдущего разделителя слов.

    2. Обновите (по умолчанию) данные этого ключевого значения, указав имя файла предыдущего средства разбиения по словам из таблицы.

    3. Если в выбранном языке используется стеммер, добавьте новый ключ со значением предыдущего стеммера из таблицы.

    4. Если в выбранном языке используется стеммер, обновите значение ключа по умолчанию, указав имя файла предыдущего стеммера из таблицы.

  7. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key>. < > language_key представляет аббревиатуру языка, используемого в реестре, например "fra" для французского и "esn" для испанского языка.

  8. Замените значение раздела WBreakerClass значением текущего средства разбиения по словам из таблицы.

  9. Если в выбранном языке используется стеммер, замените значение ключа StemmerClass на значение для текущего стеммера из таблицы.

  10. Перезапуск SQL Server.

Восстановление текущих компонентов

  1. Перейдите в расположение, в котором вы создали резервную копию версии SQL Server NaturalLanguage6.dll.

  2. Скопируйте текущую версию NaturalLanguage6.dll из расположения резервной копии в папку Binn экземпляра SQL Server.

    Предупреждение

    Это изменение затрагивает все языки, использующие файл NaturalLanguage6.dll, в текущей и в предыдущей версии.

  3. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID.

  4. Если следующие ключи не существуют, выполните следующие шаги, чтобы добавить новые ключи для идентификаторов классов COM текущих интерфейсов средства разбиения по словам и стеммера для выбранного языка.

    1. Добавьте новый раздел со значением текущего средства разбиения по словам из таблицы.

    2. Обновите значение (по умолчанию) этого ключа, указав имя файла текущего средства разбиения по словам из таблицы.

    3. Если в выбранном языке используется стеммер, добавьте новый ключ со значением из таблицы для текущего стеммера.

    4. Если в выбранном языке используется стеммер, обновите значение (по умолчанию) этого ключа на имя файла текущего стеммера из таблицы.

  5. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key>. < > language_key представляет аббревиатуру языка, используемого в реестре, например "fra" для французского и "esn" для испанского языка.

  6. Обновите значение ключа WBreakerClass до значения из таблицы для предыдущего средства разбиения по словам.

  7. Если в выбранном языке используется стеммер, обновите значение ключа StemmerClass на значение из таблицы для предыдущего стеммера.

  8. Перезапуск SQL Server.

Имена файлов и значения реестра для восстановления средств разбиения по словам и стеммеров

Используйте следующий список имен файлов и записей реестра совместно с инструкциями из предыдущего раздела. Используйте предыдущие значения, чтобы вернуться к использованию предыдущей версии, либо используйте текущие значения, чтобы восстановить текущую версию компонентов.

Следующий список отсортирован в алфавитном порядке по сокращению, используемому для каждого языка.

Арабский (ara), LCID 1025

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID 7EFD3C7E-9E4B-4a93-9503-DECD74C0AC6D 483B0283-25DB-4c92-9C15-A65925CB95CE
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID 04b37e30-c9a9-4a7d-8f20-792fc87ddf71 нет
Текущее имя файла MSWB7.dll нет

Немецкий (deu), LCID 1031

Компонент Анализатор слов Стеммер
Предыдущий идентификатор CLSID 45EACA36-DBE9-4e4a-A26D-5C201902346D 65170AE4-0AD2-4fa5-B3BA-7CD73E2DA825
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID dfa00c33-bf19-482e-a791-3c785b0149b4 8a474d89-6e2f-419c-8dd5-9b50edc8c787
Текущее имя файла MSWB7.dll MSWB7.dll

Японский (jpn), LCID 1041

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID E1E8F15E-8BEC-45df-83BF-50FF84D0CAB5 3D5DF14F-649F-4cbc-853D-F18FEDE9CF5D
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID 04096682-6ece-4e9e-90c1-52d81f0422ed нет
Текущее имя файла MsWb70011.dll нет

Нидерландский (nld), LCID 1043

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID 2C9F6BEB-C5B0-42b6-A5EE-84C24DC0D8EF F7A465EE-13FB-409a-B878-195B420433AF
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID 69483c30-a9af-4552-8f84-a0796ad5285b CF923CB5-1187-43ab-B053-3E44BED65FFA
Текущее имя файла MSWB7.dll MSWB7.dll

Русский (rus), LCID 1049

Компонент Средство разделения слов стеммер
Предыдущий идентификатор CLSID 2CB6CDA4-1C14-4392-A8EC-81EEF1F2E079 E06A0DDD-E81A-4e93-8A8D-F386C3A1B670
Предыдущее имя файла NaturalLanguage6.dll NaturalLanguage6.dll
Текущий идентификатор CLSID aaa3d3bd-6de7-4317-91a0-d25e7d3babc3 d42c8b70-adeb-4b81-a52f-c09f24f77dfa
Текущее имя файла MSWB7.dll MSWB7.dll

Языки, для которых ни предыдущее, ни текущее имя файла не является NaturalLanguage6.dll

Для языков в следующей таблице имена файлов предыдущей версии средств разбиения по словам и стеммеров отличаются от имен файлов новой версии. NaturalLanguage6.dll не является ни текущим, ни предыдущим именем файла. Вам не нужно заменить файлы, так как программа установки SQL Server копирует текущие и предыдущие версии компонентов в папку Binn. Однако необходимо изменить набор записей реестра, указав в них предыдущую или текущую версию компонентов.

Список затронутых языков

Язык Аббревиатура
применяется в
реестр
LCID
Упрощенный китайский chs 2052
Традиционный китайский cht 1028
Тайский tha 1054
китайский (традиционный) zh-hk 3076
китайский (традиционный) zh-mo 5124
китайский (упрощенный) zh-sg 4100

Предыдущая таблица отсортирована в алфавитном порядке по столбцу «Аббревиатура».

Используйте следующие инструкции вместе со списком значений в разделе Имена файлов и значения реестра для отмены и восстановления разделителей слов и стеммеров.

Возврат к использованию предыдущих компонентов.

  1. Не удаляйте файлы текущей версии компонентов из папки Binn.

  2. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID.

  3. Чтобы добавить новые ключи для идентификаторов классов COM предыдущих интерфейсов разбивателя слов и стеммера для выбранного языка, выполните следующие действия.

    1. Добавьте новый ключ со значением из таблицы для предыдущего средства разбиения по словам.

    2. Обновите данные (Default) для этого ключа, указав имя файла предыдущей версии средства разбиения слов из таблицы.

    3. Если в выбранном языке используется стеммер, добавьте новый ключ со значением предыдущего стеммера из таблицы.

    4. Если в выбранном языке используется стеммер, то обновите (по умолчанию) данные этого ключевого значения, указав имя файла предыдущего стеммера из таблицы.

  4. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key>. < > language_key представляет аббревиатуру языка, используемого в реестре, например "fra" для французского и "esn" для испанского языка.

  5. Обновите ключевое значение WBreakerClass до значения из таблицы для текущего средства разбиения по словам.

  6. Если в выбранном языке используется стеммер, замените значение ключа StemmerClass на значение из таблицы для текущего стеммера.

  7. Перезапуск SQL Server.

Восстановление предыдущих компонентов

  1. Не удаляйте файлы предыдущей версии компонентов из папки Binn.

  2. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\CLSID.

  3. Если следующие разделы не существуют, выполните следующие шаги, чтобы добавить новые разделы для идентификаторов классов COM текущих интерфейсов средства разбиения по словам и парадигматического модуля для выбранного языка.

    1. Добавьте новый ключ со значением из таблицы для текущего средства разбиения по словам.

    2. Обновите значение по умолчанию этого ключа, указав имя файла текущей версии средства разбиения по словам из таблицы.

    3. Если в выбранном языке используется стеммер, добавьте новый ключ со значением из таблицы для текущего стеммера.

    4. Если в выбранном языке используется стеммер, обновите значение (по умолчанию) этого ключа, указав имя файла текущего стеммера из таблицы.

  4. В реестре перейдите к следующему узлу: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft SQL Server<InstanceRoot>\MSSearch\Language<language_key>. < > language_key представляет аббревиатуру языка, используемого в реестре, например "fra" для французского и "esn" для испанского языка.

  5. Обновите ключевое значение WBreakerClass на значение из таблицы для предыдущего средства разбиения по словам.

  6. Если в выбранном языке используется парадигматический модуль, замените значение раздела StemmerClass значением предыдущего парадигматического модуля из таблицы.

  7. Перезапуск SQL Server.

Имена файлов и значения реестра для возврата к использованию и восстановления средств разбиения по словам и парадигматических модулей

Используйте следующий список имен файлов и записей реестра совместно с инструкциями из предыдущего раздела. Используйте предыдущие значения, чтобы вернуться к использованию предыдущей версии, либо используйте текущие значения, чтобы восстановить текущую версию компонентов.

Следующий список отсортирован в алфавитном порядке по сокращению, используемому для каждого языка.

Упрощенный китайский (chs), LCID 2052

Компонент Модуль сегментации на слова
Предыдущий идентификатор CLSID 12CE94A0-DEFB-11D2-B31D-00600893A857
Предыдущее имя файла chsbrkr.dll
Текущий идентификатор CLSID E0831C90-BAB0-4ca5-B9BD-EA254B538DAC
Текущее имя файла MsWb70804.dll

Традиционный китайский (cht), LCID 1028

Компонент Средство разбиения по словам
Предыдущий идентификатор CLSID 1680E7C3-9430-4A51-9B82-1E7E7AEE5258
Предыдущее имя файла chtbrkr.dll
Текущий идентификатор CLSID E9B1DF65-08F1-438b-8277-EF462B23A792
Текущее имя файла MsWb70404.dll

Тайский (tha), LCID 1054

Компонент Разделитель слов Стеммер
Предыдущий идентификатор CLSID CCA22CF4-59FE-11D1-BBFF-00C04FB97FDA CEDC01C7-59FE-11D1-BBFF-00C04FB97FDA
Предыдущее имя файла Thawbrkr.dll Thawbrkr.dll
Текущий идентификатор CLSID F70C0935-6E9F-4ef1-9F06-7876536DB900 нет
Текущее имя файла MsWb7001e.dll нет

Китайский традиционный (zh-hk), LCID 3076

Компонент Разделитель слов
Предыдущий идентификатор CLSID 1680E7C3-9430-4A51-9B82-1E7E7AEE5258
Предыдущее имя файла chtbrkr.dll
Текущий идентификатор CLSID E9B1DF65-08F1-438b-8277-EF462B23A792
Текущее имя файла MsWb70404.dll

Китайский традиционный (zh-mo), LCID 5124

Компонент Разделитель слов
Предыдущий идентификатор CLSID 1680E7C3-9430-4A51-9B82-1E7E7AEE5258
Предыдущее имя файла chtbrkr.dll
Текущий идентификатор CLSID E9B1DF65-08F1-438b-8277-EF462B23A792
Текущее имя файла MsWb70404.dll

Китайский упрощенный (zh-sg), LCID 4100

Компонент Разделитель слов
Предыдущий идентификатор CLSID 12CE94A0-DEFB-11D2-B31D-00600893A857
Предыдущее имя файла chsbrkr.dll
Текущий идентификатор CLSID E0831C90-BAB0-4ca5-B9BD-EA254B538DAC
Текущее имя файла MsWb70804.dll

См. также

Изменение средства разбиения по словам, используемого для английского (США) и английского (Британского)
Изменения в функциях полнотекстового поиска