Guide sur les formats de documents et les conventions d’affectation de noms
N’importe quel fichier utilisé pour un modèle de traduction personnalisée doit être d’au moins quatre caractères.
Cette table comprend tous les formats de fichier pris en charge que vous pouvez utiliser pour générer votre système de traduction :
Format | Extensions | Description |
---|---|---|
XLIFF |
.XLF , .XLIFF |
Un format de document parallèles, pour les systèmes d’exportation de mémoires de traductions. Les langues utilisées sont définies dans le fichier. |
TMX |
.TMX |
Un format de document parallèles, pour les systèmes d’exportation de mémoires de traductions. Les langues utilisées sont définies dans le fichier. |
ZIP |
.ZIP |
Un format de fichier d’archive. |
Locstudio |
.LCL |
Un format de Microsoft pour les documents parallèles |
Microsoft Word | .DOCX |
Document Microsoft Word |
Adobe Acrobat | .PDF |
Document de la version portable d’Adobe Acrobat |
HTML |
.HTML , .HTM |
Document HTML (HyperText Markup Language) |
Fichier texte | .TXT |
Fichiers texte encodés en UTF-16 ou UTF-8. Le nom de fichier ne doit pas contenir de caractères japonais. |
Fichier d’alignement de textes | .ALIGN |
L’extension .ALIGN est une extension spéciale que vous pouvez utiliser si vous savez que des phrases de votre paire de documents se correspondent parfaitement. Si vous fournissez un fichier .ALIGN , Custom Translator n’aligne pas les phrases pour vous. |
Fichier Excel | .XLSX |
Fichier Excel (2013 ou version ultérieure). La première ligne de la feuille de calcul doit être le code de langue. |
Formats de dictionnaires
Pour les dictionnaires, Custom Translator prend en charge tous les formats de fichier pris en charge pour les jeux d’entraînement. Si vous utilisez un dictionnaire Excel, la première ligne de la feuille de calcul doit correspondre aux codes de langue.
Formats de fichiers compressés
Les documents peuvent être regroupées dans un seul fichier compressé et téléchargés. Custom Translator prend en charge les formats de fichiers compressés (ZIP
, GZ
, et TGZ
).
Chaque document du fichier zip avec l’extension TXT, HTML, HTM, PDF, DOCX, ALIGN doit suivre cette convention de nommage :
{nom du document}_{code de langue} où {nom du document} correspond au nom de votre document, {code de langue} correspond au LanguageID ISO (deux caractères), indiquant que le document contient des phrases dans cette langue. Il doit y avoir le code de langue doit être précédé d’un trait de soulignement (_).
Par exemple, afin de charger deux documents parallèles dans un fichier zip pour un système traduisant de l’anglais vers l’espagnol, les fichiers doivent être nommés data_en
et data_es
.
Cette convention de nommage utilisée pour indiquer une langue spécifique ne s’applique pas aux fichiers de mémoire de traduction (TMX
, XLF
, XLIFF
, LCL
, XLSX
).