Compartir vía


Guía sobre formatos y convenciones de nomenclatura para documentos

Cualquier archivo que se utilice para la traducción personalizada debe tener al menos cuatro caracteres de longitud.

Esta tabla incluye todos los formatos de archivo compatibles que puede usar para crear el sistema de traducción:

Formato Extensiones Descripción
XLIFF .XLF, .XLIFF Formato de documento paralelo que se exporta desde los sistemas de memoria de traducción. Los idiomas utilizados se definen dentro del archivo.
TMX .TMX Formato de documento paralelo que se exporta desde los sistemas de memoria de traducción. Los idiomas utilizados se definen dentro del archivo.
ZIP .ZIP Un formato de archivo de almacenamiento.
Locstudio .LCL Formato de Microsoft para los documentos paralelos
Microsoft Word .DOCX Documento de Microsoft Word
Adobe Acrobat .PDF Documento portátil de Adobe Acrobat
HTML .HTML, .HTM Documento del lenguaje de marcado de hipertexto
Archivo de texto .TXT Archivos de texto codificados en UTF-16 o UTF-8. El nombre de archivo no debe contener caracteres japoneses.
Archivo de texto alineado .ALIGN La extensión .ALIGN es una extensión especial que puede usar si sabe que las oraciones del par de documentos están perfectamente alineadas. Si proporciona un archivo .ALIGN, el Traductor personalizado no alinea las oraciones por usted.
Archivo de Excel .XLSX Archivo de Excel (2013 o posterior). La primera línea o fila de la hoja de cálculo debe ser el código de idioma.

Formatos de diccionario

Para los diccionarios, Traductor personalizado es compatible con todos los formatos de archivo que se admiten para los conjuntos de entrenamiento. Si está utilizando un diccionario de Excel, la primera línea o fila de la hoja de cálculo debe contener códigos de idioma.

Formatos de archivo ZIP

Los documentos se pueden agrupar en un único archivo ZIP y cargarse. Traductor personalizado es compatible con los formatos de archivo ZIP (ZIP, GZ y TGZ).

Todos los documentos del archivo zip con la extensión TXT, HTM, HTML, PDF, DOCX o ALIGN deben seguir esta convención de nomenclatura:

{nombre del documento}_{código de idioma} donde {nombre del documento} es el nombre del documento y {código de idioma} es el identificador de idioma ISO (dos caracteres), que indica que el documento contiene oraciones en ese idioma. Debe haber un guion bajo (_) antes del código de idioma.

Por ejemplo, para cargar dos documentos paralelos dentro de un archivo ZIP para un sistema de inglés a español, los archivos deben tener los nombres data_en y data_es.

No es necesario que los archivos de la memoria de traducción (TMX, XLF, XLIFF, LCL, XLSX) sigan la convención de nomenclatura de idioma específico.

Pasos siguientes