Vad är dokumentöversättning?
Dokumentöversättning är en molnbaserad maskinöversättningsfunktion i Azure AI Translator-tjänsten . Du kan översätta flera och komplexa dokument över alla språk och dialekter som stöds samtidigt som du bevarar den ursprungliga dokumentstrukturen och dataformatet. API:et för dokumentöversättning stöder två översättningsprocesser:
Asynkron batchöversättning stöder bearbetning av flera dokument och stora filer. Batchöversättningsprocessen kräver ett Azure Blob Storage-konto med lagringscontainrar för källan och översatta dokument.
Synkron enskild fil stöder bearbetning av enstaka filöversättningar. Filöversättningsprocessen kräver inget Azure Blob Storage-konto. Det slutliga svaret innehåller det översatta dokumentet och returneras direkt till den anropande klienten.
Asynkron batchöversättning
Använd asynkron dokumentbearbetning för att översätta flera dokument och stora filer.
Funktioner för Batch-nycklar
Funktion | beskrivning |
---|---|
Översätta stora filer | Översätt hela dokument asynkront. |
Översätta många filer | Översätt flera filer över alla språk och dialekter som stöds samtidigt som dokumentstrukturen och dataformatet bevaras. |
Bevara källfilpresentationen | Översätt filer samtidigt som den ursprungliga layouten och formatet bevaras. |
Tillämpa anpassad översättning | Översätta dokument med hjälp av allmänna och anpassade översättningsmodeller . |
Använda anpassade ordlistor | Översätt dokument med hjälp av anpassade ordlistor. |
Identifiera dokumentspråk automatiskt | Låt dokumentöversättningstjänsten bestämma dokumentets språk. |
Översätta dokument med innehåll på flera språk | Använd funktionen identifiera automatiskt för att översätta dokument med innehåll på flera språk till målspråket. |
Utvecklingsalternativ för Batch
Du kan lägga till dokumentöversättning i dina program med hjälp av REST-API:et eller ett SDK för klientbiblioteket:
REST-API:et. är ett språkagnostiskt gränssnitt som gör att du kan skapa HTTP-begäranden och auktoriseringshuvuden för att översätta dokument.
Klientbibliotekets SDK:er är språkspecifika klasser, objekt, metoder och kod som du snabbt kan använda genom att lägga till en referens i projektet. För närvarande har dokumentöversättning stöd för programmeringsspråk för C#/.NET och Python.
Dokumentformat som stöds av Batch
Metoden Hämta dokumentformat som stöds returnerar en lista över dokumentformat som stöds av dokumentöversättningstjänsten. Listan innehåller det vanliga filtillägget och innehållstypen om du använder uppladdnings-API:et.
Filtyp | Filnamnstillägg | beskrivning |
---|---|---|
Adobe PDF | pdf |
Portabelt dokumentfilformat. Dokumentöversättning använder optisk teckenigenkänningsteknik (OCR) för att extrahera och översätta text i skannade PDF-dokument samtidigt som den ursprungliga layouten bevaras. |
Kommaavgränsade värden | csv |
En kommaavgränsad rådatafil som används av kalkylbladsprogram. |
HTML | html , htm |
Hypertextmarkeringsspråk. |
Filformat för lokaliseringsutbyte | xlf | Ett parallellt dokumentformat, export av översättningsminnessystem. De språk som används definieras i filen. |
Markdown | markdown , mdown , mkdn , md , mkd , mdwn , , mdtxt , , mdtext rmd |
Ett enkelt markeringsspråk för att skapa formaterad text. |
MHTML | mthml , mht |
Ett webbsidearkivformat som används för att kombinera HTML-kod och dess tillhörande resurser. |
Microsoft Excel | xls , xlsx |
En kalkylbladsfil för dataanalys och dokumentation. |
Microsoft Outlook | msg |
Ett e-postmeddelande som skapats eller sparats i Microsoft Outlook. |
Microsoft PowerPoint | ppt , pptx |
En presentationsfil som används för att visa innehåll i ett bildspelsformat. |
Microsoft Word | doc , docx |
En textdokumentfil. |
OpenDocument-text | odt |
En textdokumentfil med öppen källkod. |
OpenDocument-presentation | odp |
En presentationsfil med öppen källkod. |
OpenDocument-kalkylblad | ods |
En kalkylbladsfil med öppen källkod. |
RTF-format | rtf |
Ett textdokument som innehåller formatering. |
Tabbavgränsade värden/TABB | tsv /tab |
En flikavgränsad rådatafil som används av kalkylbladsprogram. |
Text | txt |
Ett oformaterat textdokument. |
Batch Legacy-filtyper
Källfiltyper bevaras under dokumentöversättningen med följande undantag:
Källfilnamnstillägg | Översatt filnamnstillägg |
---|---|
.doc, .odt, .rtf, | .docx |
.xls, .ods | .xlsx |
.ppt, .odp | .pptx |
Ordlisteformat som stöds i Batch
Dokumentöversättning stöder följande ordlistefiltyper:
Filtyp | Filnamnstillägg | beskrivning |
---|---|---|
Kommaavgränsade värden | csv |
En kommaavgränsad rådatafil som används av kalkylbladsprogram. |
Filformat för lokaliseringsutbyte | xlf , xliff |
Ett parallellt dokumentformat, export av översättningsminnessystem De språk som används definieras i filen. |
Tabbavgränsade värden/TABB | tsv , tab |
En flikavgränsad rådatafil som används av kalkylbladsprogram. |
Synkron översättning
Använd synkron översättningsbearbetning för att skicka ett dokument som en del av HTTP-begärandetexten och ta emot det översatta dokumentet i HTTP-svaret.
Funktioner för synkron översättningsnyckel
Funktion | beskrivning |
---|---|
Översätta ensidesfiler | Den synkrona begäran accepterar endast ett enda dokument som indata. |
Bevara källfilpresentationen | Översätt filer samtidigt som den ursprungliga layouten och formatet bevaras. |
Tillämpa anpassad översättning | Översätta dokument med hjälp av allmänna och anpassade översättningsmodeller . |
Använda anpassade ordlistor | Översätt dokument med hjälp av anpassade ordlistor. |
Översättning på ett språk | Översätt till och från ett språk som stöds. |
Identifiera dokumentspråk automatiskt | Låt dokumentöversättningstjänsten bestämma dokumentets språk. |
Använda anpassade ordlistor | Översätt ett dokument med hjälp av en anpassad ordlista. |
Synkrona dokumentformat som stöds
Filtyp | Filnamnstillägg | Innehållstyp | beskrivning |
---|---|---|---|
Klartext | .txt |
text/plain |
Ett oformaterat textdokument. |
Tabbavgränsade värden | .txv .tab |
text/tab-separated-values |
Ett textfilformat som använder flikar för att separera värden och nya poster för att separera poster. |
Kommaavgränsade värden | .csv |
text/csv |
Ett textfilformat som använder kommatecken som avgränsare mellan värden. |
HyperText-markeringsspråk | .html .htm |
text/html |
HTML är ett standardpåläggsspråk som används för att strukturera webbsidor och innehåll. |
MHTML | .mthml .mht |
message/rfc822 @ application/x-mimearchive @ multipart/related |
Ett filformat för webbsidearkiv. |
Microsoft PowerPoint | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Ett XML-baserat filformat som används för PowerPoint-bildspelspresentationer. |
Microsoft Excel | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Ett XML-baserat filformat som används för Excel-kalkylblad. |
Microsoft Word | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Ett XML-baserat filformat som används för Word-dokument. |
Microsoft Outlook | .msg |
application/vnd.ms-outlook |
Ett filformat som används för lagrade Outlook-e-postmeddelandeobjekt. |
Xml-lokaliseringsutbyte | .xlf .xliff |
application/xliff+xml |
Ett standardiserat XML-baserat filformat som ofta används vid bearbetning av översättnings- och lokaliseringsprogram. |
Ordlisteformat som stöds synkront
Dokumentöversättning stöder följande ordlistefiltyper:
Filtyp | Filnamnstillägg | beskrivning |
---|---|---|
Kommaavgränsade värden | csv |
En kommaavgränsad rådatafil som används av kalkylbladsprogram. |
XmlLocalizationInterchange | xlf , xliff |
Ett XML-baserat format som är utformat för att standardisera hur data skickas under lokaliseringsprocessen. |
TabSeparatedValues | tsv , tab |
En flikavgränsad rådatafil som används av kalkylbladsprogram. |
Begränsningar för begäran om dokumentöversättning
Detaljerad information om begränsningar för Azure AI Translator Service-begäranden finns i Begränsningar för begäran om dokumentöversättning.
Datahemvist för dokumentöversättning
Datahemvist för dokumentöversättning beror på den Azure-region där din Translator-resurs skapades:
✔️ Funktion: Slutpunkt för dokumentöversättningstjänsten ✔️
: Anpassad: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1
Resurs skapad region | Begära bearbetning av datacenter |
---|---|
Global | Närmaste tillgängliga datacenter. |
Nord- och Sydamerika | USA, östra 2 • USA, västra 2 |
Asien och stillahavsområdet | Japan, östra • Sydostasien |
Europa (utom Schweiz) | Frankrike, centrala • Europa, västra |
Schweiz | Schweiz, norra • Schweiz, västra |
Nästa steg
I vår snabbstart lär du dig att snabbt komma igång med hjälp av dokumentöversättning. Till att börja med behöver du ett aktivt Azure-konto. Om du inte har någon, kan du skapa ett kostnadsfritt konto.