Распознавание языка Майкрософт
Служба распознавания языка ELS называется Распознавание языка Майкрософт. Эта служба использует запатентованную корпорацией Майкрософт технологию, чтобы приложения могли определять язык, на котором написан конкретный текст.
Входные данные для распознавания языка Майкрософт
Входными данными для службы распознавания языка (Майкрософт) является текст UTF-16 (нормализованная форма C). Служба должна определить язык для этого текста.
Выходные данные распознавания языка Майкрософт
Служба распознавания языка (Майкрософт) извлекает строку UTF-16, которая имеет двойное завершение null, в формате реестра, представленную их именами, разделенную разделителями символов NULL. Список отсортирован по релевантности. Для большинства языков используются нейтральные имена. Однако для некоторых, например sr-Cyrl, sr-Latn, zh-Hant и zh-Hans, используются полные имена.
Операция распознавания языка (Майкрософт)
Служба распознавания языка Майкрософт проверяет скрипт Юникода текста, предоставленного приложением. Он сегментирует текст на основе обнаруженных скриптов, а затем определяет язык, на котором написан каждый сегмент. Если скрипт указывает один язык, он гарантированно будет присутствовать в выходном списке языков. Служба использует запатентованный алгоритм для определения релевантности каждого поддерживаемого языка.
Идентификатор GUID распознавания языка (Майкрософт)
Guid для службы распознавания языка Майкрософт объявлен в файле Elssrvc.h, как показано в следующем коде.
// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
{ 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };
Связанные темы