Partilhar via


Deteção de idioma da Microsoft

O serviço de deteção de idioma do ELS é chamado de Deteção de Idioma da Microsoft. Este serviço utiliza tecnologia patenteada pela Microsoft para permitir que as aplicações detetem o idioma em que o texto específico é escrito.

Entrada para a deteção de idioma da Microsoft

A entrada para o serviço Microsoft Language Detection é texto UTF-16 (formato C normalizado). O serviço tem de determinar a língua deste texto.

Saída da deteção de idioma da Microsoft

O serviço de Deteção de Idiomas da Microsoft recupera uma cadeia de caracteres UTF-16 com terminação dupla nula e formatada no Registro listando idiomas, representados por seus nomes, separados por delimitadores de caracteres nulos. A lista é ordenada por relevância. Para a maioria das línguas, são utilizados nomes neutros. No entanto, para alguns, por exemplo, sr-Cyrl, sr-Latn, zh-Hant, e zh-Hans, nomes completos são usados.

Operação de deteção de idioma da Microsoft

O serviço Microsoft Language Detection verifica o script Unicode do texto fornecido pelo aplicativo. Ele segmenta o texto com base nos scripts que deteta e, em seguida, determina a linguagem na qual cada segmento é escrito. Se um script indicar um único idioma, é garantido que o idioma estará presente na lista de saída de idiomas. O serviço usa um algoritmo patenteado para determinar a relevância de cada idioma suportado.

GUID de deteção de idioma da Microsoft

O GUID para o serviço Microsoft Language Detection é declarado em Elssrvc.h, conforme mostrado no código a seguir.

// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
    { 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };

Sobre os Serviços Linguísticos Alargados