Microsoft 语言检测

ELS 语言检测服务称为 Microsoft 语言检测。 此服务使用 Microsoft 专利技术,允许应用程序检测编写特定文本时使用的语言。

Microsoft 语言检测的输入

Microsoft 语言检测服务的输入是 UTF-16 (规范化形式的 C) 文本。 服务必须确定此文本的语言。

Microsoft 语言检测的输出

Microsoft 语言检测服务检索以双 null 结尾、注册表格式的 UTF-16 字符串,其中列出了用语言名称表示的语言,并用 null 字符分隔符分隔。 列表按相关性排序。 对于大多数语言,将使用非特定名称。 但是,对于某些人(例如 sr-Cyrl、sr-Latn、zh-Hant 和 zh-Hans),则使用全名。

Microsoft 语言检测操作

Microsoft 语言检测服务检查应用程序提供的文本的 Unicode 脚本。 它根据检测到的脚本对文本进行分段,然后确定写入每个段的语言。 如果脚本指示单一语言,则保证语言出现在语言的输出列表中。 该服务使用专利算法来确定每种受支持语言的相关性。

Microsoft 语言检测 GUID

Microsoft 语言检测服务的 GUID 在 Elssrvc.h 中声明,如以下代码所示。

// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
    { 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };

关于扩展语言服务