Обнаружение языка Майкрософт
Служба обнаружения языков ELS называется обнаружением языка Майкрософт. Эта служба использует технологию, патентуемую корпорацией Майкрософт, чтобы разрешить приложениям обнаруживать язык, на котором написан конкретный текст.
Входные данные для обнаружения языков Майкрософт
Входные данные службы распознавания языка Майкрософт — это текст UTF-16 (нормализованная форма C). Служба должна определить язык для этого текста.
Выходные данные обнаружения языков Майкрософт
Служба обнаружения языка Майкрософт извлекает языки перечисления строк, отформатированные в реестре, отформатированные в формате NULL, языки перечисления строк, представленные именами, разделенными разделителями null. Список отсортирован по релевантности. Для большинства языков используются нейтральные имена. Однако для некоторых, например, sr-Cyrl, sr-Latn, zh-Hant и zh-Hans, используются полные имена.
Операция обнаружения языка Майкрософт
Служба обнаружения языков Майкрософт проверяет скрипт Юникода текста, предоставленного приложением. Он сегментирует текст на основе обнаруженных скриптов, а затем определяет язык, в котором записывается каждый сегмент. Если скрипт указывает один язык, он гарантированно будет присутствовать в выходном списке языков. Служба использует патентованный алгоритм для определения релевантности каждого поддерживаемого языка.
GUID обнаружения языков Майкрософт
GUID службы распознавания языка Майкрософт объявлен в Elssrvc.h, как показано в следующем коде.
// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
{ 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };
Связанные разделы