ドキュメント翻訳で用語集を使用する
用語集とは、ドキュメント翻訳サービスで翻訳プロセス中に使用するために作成する、用語と定義の一覧です。 現在、用語集機能では、1 対 1 のソースからターゲットへの言語翻訳がサポートされています。 用語集の一般的なユース ケースは次のとおりです。
コンテキスト固有の用語。 一意のコンテキストに対して特定の意味を指定する用語集を作成します。
翻訳なし。 たとえば、ソースとターゲットのテキストが同じ用語集を使用して、ドキュメント翻訳による製品名ブランドの翻訳を制限できます。
あいまいな単語に対して指定された翻訳。 多義語に対して、特定の翻訳を選択します。
用語集ファイルを作成、アップロード、使用する
用語集ファイルを作成します。 翻訳で使用するすべての用語と語句を含む、サポートされている形式 (タブ区切りの値を推奨) でファイルを作成します。
ファイル形式がサポートされているかどうかを確認するには、「サポートされる用語集の形式の取得」を "参照してください"。
次の英語ソースの用語集には、コンテキストに応じて異なる意味を持つ単語が含まれています。 用語集には、精度を確保するために、ファイル内の各単語に対して期待される翻訳が用意されています。
たとえば、金融関連の文書で単語
Bank
が使用される場合、その金融での意味を反映するように翻訳する必要があります。 地理に関する文書で単語Bank
が使用される場合は、地理的な意味を反映して「岸」を指す場合があります。 同様に、単語Crane
は「鳥」または「機械」を指す場合があります。"用語集 .tsv ファイルの例: 英語からフランス語"
Bank Banque Card Carte Crane Grue Office Office Tiger Tiger US United States
用語集を Azure Storage にアップロードします。 この手順を完了するには、ストレージ アカウント内に BLOB データを格納および整理するためのコンテナーがある Azure Blob Storage アカウントが必要です。
翻訳要求で用語集を指定します。
POST
要求に、glossary URL
、format
、version
を含めます。{ "inputs": [ { "source": { "sourceUrl": "https://my.blob.core.windows.net/source-en" }, "targets": [ { "targetUrl": "https://my.blob.core.windows.net/target-fr", "language": "fr", "glossaries": [ { "glossaryUrl": "https://my.blob.core.windows.net/glossaries/en-fr.tsv", "format": "tsv" } ] } ] } ] }
注意
この例では、有効なシステム割り当てマネージド ID と、ストレージ BLOB データ共同作成者ロールの割り当てを使用して認可を行いました。 詳細については、「ドキュメント翻訳のマネージド ID」を "参照 してください"。
大文字小文字の区別
Azure AI Translator サービス API では、既定で大文字と小文字が区別されます。つまり、大文字と小文字に基づいてソース テキスト内の用語と照合します。
部分的な文への適用。 用語集が文の一部に適用される場合、Document Translation API によって、用語集の用語がソース テキストの大文字と小文字と一致するかどうかが確認されます。 大文字と小文字が一致しない場合、用語集は適用されません。
完全な文への適用。 用語集が完全な文に適用される場合、サービスでは大文字と小文字が区別されなくなります。 ソース テキストの大文字と小文字に関係なく、用語集の用語と照合します。 この条件により、慣用句や引用符を含むユース ケースにおいて正しい結果が適用されます。
次のステップ
任意のプログラミング言語を使用してドキュメント全体を非同期的に翻訳するには、ドキュメント翻訳の攻略ガイドをお試しください。