Использование глоссариев с переводом документов
Глоссарий — это список терминов с определениями, которые создаются для службы перевода документов для использования во время процесса перевода. В настоящее время функция глоссария поддерживает перевод одного к одному источнику на целевой язык. Распространенные варианты использования глоссариев включают:
Терминология, зависят от контекста. Создайте глоссарий, указывающий конкретные значения для уникального контекста.
Нет перевода. Например, можно ограничить перевод названия документов брендами продуктов с помощью глоссария с тем же исходным и целевым текстом.
Указанные переводы для неоднозначных слов. Выберите конкретный перевод для полиземантических слов.
Создание, отправка и использование глоссарийного файла
Создайте глоссарий файл. Создайте файл в поддерживаемом формате (предпочтительно разделенные табуляции значения), который содержит все термины и фразы, которые вы хотите использовать в переводе.
Чтобы проверить, поддерживается ли формат файла, см. статью"Получение поддерживаемых форматов глоссарий".
Следующий глоссарий английского источника содержит слова, которые могут иметь разные значения в зависимости от контекста. Глоссарий предоставляет ожидаемый перевод для каждого слова в файле, чтобы обеспечить точность.
Например, когда слово
Bank
отображается в финансовом документе, оно должно быть переведено, чтобы отразить его финансовое значение. Если словоBank
отображается в географическом документе, оно может ссылаться на берег, чтобы отразить его топологичное значение. Аналогичным образом, словоCrane
может ссылаться на птицу или машину.Пример глоссария TSV-файла: английский и французский
Bank Banque Card Carte Crane Grue Office Office Tiger Tiger US United States
Отправьте глоссарий в хранилище Azure. Чтобы выполнить этот шаг, вам потребуется учетная запись Хранилище BLOB-объектов Azure с контейнерамидля хранения и упорядочивания данных BLOB-объектов в учетной записи хранения.
Укажите глоссарий в запросе на перевод.
glossary URL
Включите иformat
version
в запросPOST
:{ "inputs": [ { "source": { "sourceUrl": "https://my.blob.core.windows.net/source-en" }, "targets": [ { "targetUrl": "https://my.blob.core.windows.net/target-fr", "language": "fr", "glossaries": [ { "glossaryUrl": "https://my.blob.core.windows.net/glossaries/en-fr.tsv", "format": "tsv" } ] } ] } ] }
Примечание.
В примере используется управляемое удостоверение, назначаемое системой, с назначением роли участника данных BLOB-объектов хранилища для авторизации. Дополнительные сведения см. в разделе "Управляемые удостоверения" для перевода документов.
Учет регистра
По умолчанию API службы Azure AI Translator учитывает регистр, что означает, что он соответствует терминам в исходном тексте на основе регистра.
Приложение с частичным предложением. Если глоссарий применяется к части предложения, API перевода документов проверяет, соответствует ли термин глоссария в исходном тексте. Если регистр не соответствует, глоссарий не применяется.
Полное приложение предложения. Когда глоссарий применяется к полному предложению, служба становится нечувствительной к регистру. Он соответствует термину глоссария, независимо от его регистра, в исходном тексте. Этот атрибут помогает возвращать правильные результаты для вариантов использования с использованием идиом и кавычки.
Следующие шаги
Попробуйте руководство по переводу документов асинхронно переводить целые документы с помощью выбранного языка программирования: