Doprovodné materiály pro zásady vytváření názvů a formáty dokumentů
Každý soubor použitý pro vlastní překlad musí mít délku alespoň čtyři znaky.
Tato tabulka obsahuje všechny podporované formáty souborů, které můžete použít k vytvoření systému překladu:
Formát | Rozšíření | Popis |
---|---|---|
XLIFF |
.XLF , .XLIFF |
Paralelní formát dokumentu, export systémů paměti překladu. Používané jazyky jsou definovány uvnitř souboru. |
TMX |
.TMX |
Paralelní formát dokumentu, export systémů paměti překladu. Používané jazyky jsou definovány uvnitř souboru. |
ZIP |
.ZIP |
Formát souboru archivu. |
Locstudio |
.LCL |
Formát Microsoftu pro paralelní dokumenty |
Microsoft Word | .DOCX |
Microsoft Word dokument |
Adobe Acrobat | .PDF |
Přenosný dokument Aplikace Adobe Acrobat |
HTML |
.HTML , .HTM |
Dokument jazyka značek hypertextu |
Textový soubor | .TXT |
Textové soubory s kódováním UTF-16 nebo UTF-8 Název souboru nesmí obsahovat japonské znaky. |
Zarovnaný textový soubor | .ALIGN |
Rozšíření .ALIGN je speciální rozšíření, které můžete použít, pokud víte, že věty ve dvojici dokumentů jsou dokonale zarovnané. Pokud zadáte .ALIGN soubor, Custom Translator za vás nezarovná věty. |
Excelový soubor | .XLSX |
Excelový soubor (2013 nebo novější) První řádek nebo řádek tabulky by měl být kód jazyka. |
Formáty slovníku
Pro slovníky podporuje Custom Translator všechny formáty souborů, které se podporují pro trénovací sady. Pokud používáte slovník v Excelu, měl by první řádek nebo řádek tabulky obsahovat kódy jazyka.
Formáty souborů ZIP
Dokumenty je možné seskupit do jednoho souboru ZIP a nahrát je. Custom Translator podporuje formáty souborů ZIP (ZIP
, GZ
a TGZ
).
Každý dokument v souboru ZIP s příponou TXT, HTML, HTM, PDF, DOCX, ALIGN musí dodržovat tuto konvenci pojmenování:
{název dokumentu}_{kód jazyka}, kde {document name} je název dokumentu, {language code} je IDENTIFIKÁTOR ISO LanguageID (dva znaky), který označuje, že dokument obsahuje věty v tomto jazyce. Před kódem jazyka musí být podtržítko (_).
Pokud chcete například nahrát dva paralelní dokumenty v souboru ZIP pro systém překladu z angličtiny do španělštiny, měli byste tyto soubory pojmenovat data_en
a data_es
.
Soubory paměti překladu (TMX
, XLF
, XLIFF
, LCL
, XLSX
) se nevyžadují, aby dodržovaly specifické zásady vytváření názvů jazyka.