Co je překlad dokumentu?
Překlad dokumentů je cloudová funkce strojového překladu služby Azure AI Translator . Při zachování původní struktury dokumentů a datového formátu můžete přeložit více a složitých dokumentů ve všech podporovaných jazycích a dialektech . Rozhraní API pro překlad dokumentů podporuje dva procesy překladu:
Asynchronní dávkové překlady podporují zpracování více dokumentů a velkých souborů. Proces dávkového překladu vyžaduje účet služby Azure Blob Storage s kontejnery úložiště pro vaše zdrojové a přeložené dokumenty.
Synchronní jeden soubor podporuje zpracování jednoho překladu souborů. Proces překladu souborů nevyžaduje účet služby Azure Blob Storage. Konečná odpověď obsahuje přeložený dokument a vrátí se přímo volajícímu klientovi.
Asynchronní dávkové překlady
K překladu více dokumentů a velkých souborů použijte asynchronní zpracování dokumentů.
Klíčové funkce služby Batch
Funkce | Popis |
---|---|
Překlad velkých souborů | Asynchronní překlad celých dokumentů |
Překlad mnoha souborů | Při zachování struktury dokumentů a formátu dat můžete přeložit více souborů ve všech podporovaných jazycích a dialektech. |
Zachování prezentace zdrojového souboru | Soubory můžete přeložit při zachování původního rozložení a formátu. |
Použití vlastního překladu | Překlad dokumentů pomocí obecných a vlastních modelů překladu |
Použití vlastních glosářů | Překlad dokumentů pomocí vlastních glosářů |
Automatická detekce jazyka dokumentu | Nechte službu Překlad dokumentů určit jazyk dokumentu. |
Překlad dokumentů s obsahem ve více jazycích | Pomocí funkce automatického rozpoznávání můžete překládat dokumenty s obsahem ve více jazycích do cílového jazyka. |
Možnosti vývoje služby Batch
Překlad dokumentů můžete do svých aplikací přidat pomocí rozhraní REST API nebo sady SDK klientské knihovny:
Rozhraní REST API. je jazykové nezávislé rozhraní, které umožňuje vytvářet požadavky HTTP a autorizační hlavičky pro překlad dokumentů.
Sady SDK klientské knihovny jsou třídy specifické pro jazyk, objekty, metody a kód, které můžete rychle použít přidáním odkazu do projektu. Překlad dokumentů v současné době podporuje programovací jazyk C#/.NET a Python.
Formáty dokumentů podporované službou Batch
Metoda Získat podporované formáty dokumentů vrátí seznam formátů dokumentů podporovaných službou Překlad dokumentů. Seznam obsahuje společnou příponu souboru a typ obsahu, pokud používáte rozhraní API pro nahrávání.
Typ souboru | Přípona souboru | Popis |
---|---|---|
Adobe PDF | pdf |
Formát souboru přenosného dokumentu. Překlad dokumentů používá technologii optického rozpoznávání znaků (OCR) k extrakci a překladu textu v naskenovaném dokumentu PDF při zachování původního rozložení. |
Hodnoty oddělené čárkami | csv |
Soubor nezpracovaných dat oddělený čárkami používaný tabulkovými programy. |
HTML | html , htm |
Jazyk značek hypertextu |
Formát souboru Interchange pro lokalizaci | xlf | Paralelní formát dokumentu, export systémů paměti překladu. Používané jazyky jsou definovány uvnitř souboru. |
Markdown | markdown , mdown , , md mdwn mdtxt mkdn mkd , , mdtext rmd |
Jednoduchý jazyk značek pro vytváření formátovaného textu. |
MHTML | mthml , mht |
Formát archivu webové stránky, který slouží ke kombinování kódu HTML a jeho doprovodných prostředků. |
Microsoft Excel | xls , xlsx |
Tabulkový soubor pro analýzu dat a dokumentaci. |
Microsoft Outlook | msg |
E-mailová zpráva vytvořená nebo uložená v aplikaci Microsoft Outlook |
Microsoft PowerPoint | ppt , pptx |
Soubor prezentace použitý k zobrazení obsahu ve formátu prezentace. |
Microsoft Word | doc , docx |
Textový soubor dokumentu. |
OpenDocument Text | odt |
Soubor open source textového dokumentu. |
Prezentace ve formátu OpenDocument | odp |
Opensourcový soubor prezentace. |
OpenDocument Spreadsheet | ods |
Opensourcový soubor tabulky. |
Formát RTF | rtf |
Textový dokument obsahující formátování. |
Hodnoty oddělené tabulátorem /TAB | tsv /tab |
Nezpracovaný datový soubor oddělený tabulátorem používaný tabulátory. |
Text | txt |
Neformátovaný textový dokument |
Starší typy souborů služby Batch
Typy zdrojových souborů se zachovají během překladu dokumentu s následujícími výjimkami:
Přípona zdrojového souboru | Přeložená přípona souboru |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, .odp | .pptx |
Formáty glosáře podporované službou Batch
Překlad dokumentů podporuje následující typy souborů glosáře:
Typ souboru | Přípona souboru | Popis |
---|---|---|
Hodnoty oddělené čárkami | csv |
Soubor nezpracovaných dat oddělený čárkami používaný tabulkovými programy. |
Formát souboru Interchange pro lokalizaci | xlf , xliff |
Paralelní formát dokumentu, export systémů paměti překladu Jazyky, které se používají, jsou definovány uvnitř souboru. |
Hodnoty oddělené tabulátory /TAB | tsv , tab |
Nezpracovaný datový soubor oddělený tabulátorem používaný tabulátory. |
Synchronní překlad
Pomocí synchronního zpracování překladu odešlete dokument jako součást textu požadavku HTTP a obdržíte přeložený dokument v odpovědi HTTP.
Funkce synchronního klíče překladu
Funkce | Popis |
---|---|
Překlad jednostrákových souborů | Synchronní požadavek přijímá jako vstup jenom jeden dokument. |
Zachování prezentace zdrojového souboru | Soubory můžete přeložit při zachování původního rozložení a formátu. |
Použití vlastního překladu | Překlad dokumentů pomocí obecných a vlastních modelů překladu |
Použití vlastních glosářů | Překlad dokumentů pomocí vlastních glosářů |
Překlad s jedním jazykem | Přeložit do a z jednoho podporovaného jazyka |
Automatická detekce jazyka dokumentu | Nechte službu Překlad dokumentů určit jazyk dokumentu. |
Použití vlastních glosářů | Přeloží dokument pomocí vlastního glosáře. |
Synchronní podporované formáty dokumentů
Typ souboru | Přípona souboru | Typ obsahu | Popis |
---|---|---|---|
Prostý text | .txt |
text/plain |
Neformátovaný textový dokument |
Hodnoty oddělené tabulátorem | .txv .tab |
text/tab-separated-values |
Formát textového souboru, který používá tabulátory k oddělení hodnot a nových řádků k oddělení záznamů. |
Hodnoty oddělené čárkami | .csv |
text/csv |
Formát textového souboru, který používá čárky jako oddělovač mezi hodnotami. |
Jazyk značek hypertextu | .html .htm |
text/html |
HTML je standardní jazyk značek používaný ke strukturování webových stránek a obsahu. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Formát souboru archivu webové stránky. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Formát souboru založený na jazyce XML používaný pro prezentace powerpointové prezentace. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Formát souboru založený na jazyce XML používaný pro excelové tabulky. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Formát souboru založený na jazyce XML používaný pro wordové dokumenty. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Formát souboru používaný pro uložené objekty poštovní zprávy aplikace Outlook. |
Výměna lokalizací xml | .xlf .xliff |
application/xliff+xml |
Standardizovaný formát souborů založený na JAZYCE XML, který se běžně používá při zpracování překladu a lokalizačního softwaru. |
Synchronní podporované formáty glosáře
Překlad dokumentů podporuje následující typy souborů glosáře:
Typ souboru | Přípona souboru | Popis |
---|---|---|
Hodnoty oddělené čárkami | csv |
Soubor nezpracovaných dat oddělený čárkami používaný tabulkovými programy. |
XmlLocalizationInterchange | xlf , xliff |
Formát založený na jazyce XML navržený tak, aby standardizoval způsob předávání dat během procesu lokalizace. |
TabSeparatedValues | tsv , tab |
Nezpracovaný datový soubor oddělený tabulátorem používaný tabulátory. |
Omezení žádosti o překlad dokumentů
Podrobné informace o omezeních požadavků služby Azure AI Translator najdete v tématu Omezení požadavků na překlad dokumentů.
Rezidence dat překladu dokumentů
Rezidence dat překladu dokumentů závisí na oblasti Azure, ve které byl váš prostředek Translator vytvořen:
✔️ Funkce: Koncový bod služby překladu ✔️
dokumentů: Vlastní: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Vytvořená oblast prostředku | Žádost o zpracování datacentra |
---|---|
Globální | Nejbližší dostupné datové centrum |
Amerika | USA – východ 2 • USA – západ 2 |
Asie a Tichomoří | Japonsko – východ • Jihovýchodní Asie |
Evropa (s výjimkou Švýcarska) | Francie – střed • Západní Evropa |
Švýcarsko | Švýcarsko – sever • Švýcarsko – západ |
Další kroky
V našem rychlém startu se dozvíte, jak rychle začít používat překlad dokumentů. Abyste mohli začít, potřebujete aktivní účet Azure. Pokud žádné nemáte, můžete si vytvořit bezplatný účet.