Použití glosářů s překladem dokumentů
Glosář je seznam termínů s definicemi, které vytvoříte pro službu Překlad dokumentů, která se bude používat během procesu překladu. Funkce glosáře v současné době podporuje překlad mezi 1:1. Mezi běžné případy použití glosářů patří:
Terminologie specifická pro kontext Vytvořte glosář, který určuje konkrétní významy pro váš jedinečný kontext.
Žádný překlad. Překlad dokumentů můžete například omezit tak, aby překláněl značky názvů produktů pomocí glosáře se stejným zdrojovým a cílovým textem.
Zadané překlady pro nejednoznačná slova Zvolte konkrétní překlad pro polysemantická slova.
Vytvoření, nahrání a použití souboru glosáře
Vytvořte soubor glosáře. Vytvořte soubor v podporovaném formátu (nejlépe hodnot oddělených tabulátory), který obsahuje všechny termíny a fráze, které chcete použít v překladu.
Pokud chcete zkontrolovat, jestli je formát souboru podporovaný, přečtěte si článekZískání podporovaných formátů glosáře.
Následující anglický glosář obsahuje slova, která mohou mít různé významy v závislosti na kontextu. Glosář poskytuje očekávaný překlad pro každé slovo v souboru, aby se zajistila přesnost.
Pokud se například slovo
Bank
zobrazí v finančním dokumentu, mělo by se přeložit tak, aby odráželo jeho finanční význam. Pokud se slovoBank
zobrazí v geografickém dokumentu, může odkazovat na pobřeží, aby odráželo jeho topografický význam. Podobně může slovoCrane
odkazovat na ptáka nebo stroje.Příklad souboru .tsv glosáře: English-to-French
Bank Banque Card Carte Crane Grue Office Office Tiger Tiger US United States
Nahrajte glosář do úložiště Azure. K dokončení tohoto kroku potřebujete účet služby Azure Blob Storage s kontejnery k ukládání a uspořádání dat objektů blob v rámci účtu úložiště.
Zadejte svůj glosář v žádosti o překlad. Zahrňte kód
glossary URL
,format
aversion
do svéPOST
žádosti:{ "inputs": [ { "source": { "sourceUrl": "https://my.blob.core.windows.net/source-en" }, "targets": [ { "targetUrl": "https://my.blob.core.windows.net/target-fr", "language": "fr", "glossaries": [ { "glossaryUrl": "https://my.blob.core.windows.net/glossaries/en-fr.tsv", "format": "tsv" } ] } ] } ] }
Poznámka:
Příklad použil spravovanou identitu přiřazenou systémem s přiřazením role Přispěvatel dat v objektech blob služby Storage k autorizaci. Další informace najdete v tématuSpravované identity pro překlad dokumentů.
Rozlišování malých a velkých písmen
Rozhraní API služby Azure AI Translator ve výchozím nastavení rozlišují malá a velká písmena, což znamená, že odpovídá termínům ve zdrojovém textu na základě případu.
Částečná věta aplikace. Pokud je glosář použit na část věty, rozhraní API pro překlad dokumentů zkontroluje, jestli termín glosáře odpovídá případu ve zdrojovém textu. Pokud se velikost skříně neshoduje, glosář se nepoužije.
Úplná aplikace vět. Když se váš glosář použije na úplnou větu, služba se změní na nerozlišující velká a malá písmena. Odpovídá výrazu glosáře bez ohledu na jeho velikost ve zdrojovém textu. Tento atribut pomáhá vrátit správné výsledky pro případy použití zahrnující idiomy a uvozovky.
Další kroky
Vyzkoušejte si návod k asynchronnímu překladu celých dokumentů pomocí programovacího jazyka podle vašeho výběru: