Пользовательские средства разбиения по словам в SharePoint
Перенос слов является одним из ключевых функций обработки естественного языка (NLP), которые позволяют поиска и улучшить результаты поиска (или отзыва). Средства разбиения по словам разделение потока текста на отдельные слова или маркеров, на которых можно создать дополнительные языковые обработки. Средства разбиения по словам, зависящие от языка. Помимо встроенных средств разбиения по словам, поиск в SharePoint позволяет использовать пользовательские средства разбиения по словам, чтобы пользователи могли настраивать поведение разбиения слов в соответствии со своими потребностями. Список языков , поддерживаемых для настройки средства разбиения по словам, см. в статье Поддерживаемые языки для настройки средства разбиения по словам в SharePoint .
Сведения о том, как писать средство разбиения по словам можно найти в следующих статьях
Переключение на пользовательское средство разбиения по словам в SharePoint
Предостережение
[!Внимание!] При замене существующего средства разбиения по словам редактора реестра на собственный риск. Неправильное изменение реестра с помощью редактора реестра или другим способом могут возникнуть серьезные проблемы. Эти проблемы могут привести к переустановки операционной системы. Microsoft не удается убедитесь, что можно решить эти проблемы. Переключение на разных разбиения также может вызвать серьезные проблемы во время индексирования и обработки запросов. Перед изменением реестра резервное копирование реестра и убедитесь, что вы знаете, как для восстановления реестра в случае возникновения проблем.
Выполните следующие действия, чтобы заменить существующие средства разбиения по словам настраиваемого разбиения или замените существующий средства разбиения по словам разбиения на другом языке.
Откройте редактор реестра, как показано ниже:
Выберите Start, а затем выберите Run.
В диалоговом окне Open введите Regedit и нажмите кнопку OK.
В редакторе реестра выберите следующий подраздел реестра:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\15.0\Search\Setup\ContentIndexCommon\LanguageResources\Default\язык из приведенного ниже списка
В правой области откройте контекстное меню для значения реестра WBDLLPathOverride и нажмите кнопку Modify.
В диалоговом окне Edit String в поле Value data введите путь к вашей настраиваемого разбиения DLL-Библиотеку и выберите OK. Новую библиотеку DLL должен быть расположен в один и тот же путь как существующий файл DLL, который заменяется.
В правой области откройте контекстное меню для значения реестра WBreakerClass и нажмите кнопку Modify.
В диалоговом окне Изменение строки в поле Значение введите идентификатор класса пользовательского средства разбиения по словам и нажмите кнопку ОК.
Перезапустите контроллер узла поиска SharePoint и SharePoint.
Выполните полный повторный обход.
Поддерживаемые языки для настройки средства разбиения по словам в SharePoint
Для настройки средства разбиения слов word поддерживаются следующие языки:
- Арабский
- Бенгальский
- Болгарский
- Каталанский
- Китайский (Китайская Народная Республика)
- Китайский (Тайвань)
- Хорватский
- чешский;
- Датский
- Нидерландский (голландский)
- Английский (США)
- Эстонский
- Финский
- Французский (стандартный)
- Немецкий (стандартный)
- Греческий
- Гуджарати
- Иврит
- хинди;
- Венгерский
- Исландский
- Индонезийский
- Итальянский (по умолчанию)
- Японский
- Каннада
- Казахский
- корейский;
- латышский;
- Литовский
- Малайский
- Малаялам
- Маратхи
- Норвежский
- Польский
- Португальский (португальский)
- Панджаби
- Румынский
- Русский
- Сербский (кириллица)
- Словацкий
- Словенский
- Испанский (современная сортировка)
- Шведский
- Тамильский
- Телугу
- Тайский
- Украинский
- Урду
- Вьетнамский