Compartilhar via


Detecção de idioma da Microsoft

O serviço de detecção de linguagem ELS é chamado de Detecção de Idioma da Microsoft. Esse serviço usa a tecnologia patenteada pela Microsoft para permitir que os aplicativos detectem o idioma no qual um texto específico é escrito.

Entrada para Detecção de Idioma da Microsoft

A entrada para o serviço de Detecção de Idiomas da Microsoft é texto UTF-16 (formulário C normalizado). O serviço precisa determinar o idioma deste texto.

Saída da Detecção de Idioma da Microsoft

O serviço de Detecção de Idiomas da Microsoft recupera idiomas de listagem de cadeia de caracteres UTF-16 com formato de registro duplo, representados por seus nomes, separados por delimitadores de caracteres nulos. A lista é classificada por relevância. Para a maioria dos idiomas, nomes neutros são usados. No entanto, para alguns, por exemplo, sr-Cyrl, sr-Latn, zh-Hant e zh-Hans, nomes completos são usados.

Operação de detecção de idioma da Microsoft

O serviço de Detecção de Idioma da Microsoft verifica o script Unicode do texto fornecido pelo aplicativo. Ele segmenta o texto com base nos scripts que ele detecta e, em seguida, determina o idioma no qual cada segmento é gravado. Se um script indicar um único idioma, é garantido que o idioma esteja presente na lista de saída de idiomas. O serviço usa um algoritmo patenteado para determinar a relevância de cada linguagem com suporte.

GUID de Detecção de Idioma da Microsoft

O GUID para o serviço de Detecção de Idioma da Microsoft é declarado em Elssrvc.h, conforme mostrado no código a seguir.

// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
    { 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };

Sobre os Serviços Linguísticos Estendidos