Utilitaire de translittération téléchargeable gratuitement
Deux collègues de mon groupe (Nick Cipollone and Andrea Jessee) viennent tout récemment de développer un outil de translittération. Cet outil, appelé Microsoft Transliteration Utility vous permet de convertir des caractères d’une langue naturelle vers un autre jeu de caractères, par exemple le serbe en caractères latins vers le serbe en caractères cyrilliques, ou les caractères latins vers l’inuktitut. L’outil utilise un langage simple mais puissant basé sur des règles. Il peut être utilisé pour créer, éditer, déboguer et tester vos propres modules de translittération afin de convertir un jeu de graphèmes en un autre alphabet.
Vous pouvez utiliser l’outil en:
1. Tapant votre texte selon un alphabet donné dans une fenêtre et l’outil le convertira instantanément;
2. Copiant et en collant un texte dans une fenêtre où il sera converti automatiquement;
3. Lui donnant un texte au format Unicode qu’il convertira;
4. Convertissant une liste de fichiers Unicode à l’aide de l’interface offrant une ligne de commande.
Une des fonctionnalités les plus intéressantes de cet outil est sa console de développement de modules, qui permet à tout un chacun de créer, d’éditer et/ou de tester des modules de translittération nouveaux ou existants.
L’utilitaire de translittération (Microsoft Transliteration Utility) est mis gratuitement à votre disposition. Vous pouvez le télécharger à l’adresse suivante : https://www.microsoft.com/globaldev/tools/translit.mspx.
Il est livré avec 9 modules prêts à l’emploi (vous pouvez bien sûr en créer d’autres):
Bosniaque cyrillique vers alphabet latin
Bosniaque latin vers alphabet cyrillique
Serbe cyrillique vers alphabet latin
Serbe latin vers alphabet cyrillique
Hangul (coréen) vers romanisation
Inuktitut vers romanisation
Romanisation vers inuktitut
Malayalam vers romanisation
Romanisation vers malayalam
Vraiment un outil génial ou, si on veut utiliser les caractères malayalam pour le dire, വ്രൈമെന്റ് ഉന് ഒഉറ്റില് ഗെനിഅല്, ou encore, pour le dire en caractères cyrilliques, враимент ун оутил гениал.
Thierry Fontenelle
Microsoft Speech & Natural Language
Comments
- Anonymous
August 18, 2006
The comment has been removed - Anonymous
August 31, 2008
De nouveaux modules linguistiques pour Office 2007 sont à présent disponibles pour une série de nouvelles