Partager via


Détection de la langue Microsoft

Le service de détection de langue ELS est appelé Microsoft Language Detection. Ce service utilise la technologie brevetée par Microsoft pour permettre aux applications de détecter la langue dans laquelle un texte spécifique est écrit.

Entrée dans la détection de la langue Microsoft

L’entrée du service Détection de langue Microsoft est du texte UTF-16 (forme normalisée C). Le service doit déterminer la langue de ce texte.

Sortie de la détection de la langue Microsoft

Le service De détection de langue Microsoft récupère une liste de langues de chaîne UTF-16 au format de registre au format double null, représentées par leurs noms, séparées par des délimiteurs de caractères null. La liste est triée par pertinence. Pour la plupart des langues, des noms neutres sont utilisés. Toutefois, pour certains, par exemple, sr-Cyrl, sr-Latn, zh-Hant et zh-Hans, des noms complets sont utilisés.

Microsoft Language Detection Operation

Le service Microsoft Language Detection vérifie le script Unicode du texte fourni par l’application. Il segmente le texte en fonction des scripts qu’il détecte, puis détermine la langue dans laquelle chaque segment est écrit. Si un script indique une seule langue, il est garanti que la langue est présente dans la liste des langues de sortie. Le service utilise un algorithme breveté pour déterminer la pertinence de chaque langage pris en charge.

GUID de détection de langue Microsoft

Le GUID du service De détection de langue Microsoft est déclaré dans Elssrvc.h, comme indiqué dans le code suivant.

// {CF7E00B1-909B-4d95-A8F4-611F7C377702}
static const GUID ELS_GUID_LANGUAGE_DETECTION =
    { 0xCF7E00B1, 0x909B, 0x4D95, { 0xA8, 0xF4, 0x61, 0x1F, 0x7C, 0x37, 0x77, 0x02 } };

À propos des services linguistiques étendus