Поделиться через


Использование глоссариев с переводом документов

Глоссарий — это список терминов с определениями, которые создаются для службы перевода документов для использования во время процесса перевода. В настоящее время функция глоссария поддерживает перевод одного к одному источнику на целевой язык. Распространенные варианты использования глоссариев включают:

  • Терминология, зависят от контекста. Создайте глоссарий, указывающий конкретные значения для уникального контекста.

  • Нет перевода. Например, можно ограничить перевод названия документов брендами продуктов с помощью глоссария с тем же исходным и целевым текстом.

  • Указанные переводы для неоднозначных слов. Выберите конкретный перевод для полиземантических слов.

Создание, отправка и использование глоссарийного файла

  1. Создайте глоссарий файл. Создайте файл в поддерживаемом формате (предпочтительно разделенные табуляции значения), который содержит все термины и фразы, которые вы хотите использовать в переводе.

    Чтобы проверить, поддерживается ли формат файла, см. статью"Получение поддерживаемых форматов глоссарий".

    Следующий глоссарий английского источника содержит слова, которые могут иметь разные значения в зависимости от контекста. Глоссарий предоставляет ожидаемый перевод для каждого слова в файле, чтобы обеспечить точность.

    Например, когда слово Bank отображается в финансовом документе, оно должно быть переведено, чтобы отразить его финансовое значение. Если слово Bank отображается в географическом документе, оно может ссылаться на берег, чтобы отразить его топологичное значение. Аналогичным образом, слово Crane может ссылаться на птицу или машину.

    Пример глоссария TSV-файла: английский и французский

       Bank     Banque
       Card     Carte
       Crane    Grue
       Office   Office
       Tiger    Tiger
       US       United States
    
  2. Отправьте глоссарий в хранилище Azure. Чтобы выполнить этот шаг, вам потребуется учетная запись Хранилище BLOB-объектов Azure с контейнерамидля хранения и упорядочивания данных BLOB-объектов в учетной записи хранения.

  3. Укажите глоссарий в запросе на перевод. glossary URLВключите и formatversion в запросPOST:

    {
        "inputs": [
            {
                "source": {
                    "sourceUrl": "https://my.blob.core.windows.net/source-en"
                },
                "targets": [
                    {
                         "targetUrl": "https://my.blob.core.windows.net/target-fr",
                        "language": "fr",
                        "glossaries": [
                            {
                                "glossaryUrl": "https://my.blob.core.windows.net/glossaries/en-fr.tsv",
                                "format": "tsv"
                            }
                        ]
    
                    }
                ]
            }
        ]
    }
    

    Примечание.

    В примере используется управляемое удостоверение, назначаемое системой, с назначением роли участника данных BLOB-объектов хранилища для авторизации. Дополнительные сведения см. в разделе "Управляемые удостоверения" для перевода документов.

Учет регистра

По умолчанию API службы Azure AI Translator учитывает регистр, что означает, что он соответствует терминам в исходном тексте на основе регистра.

  • Приложение с частичным предложением. Если глоссарий применяется к части предложения, API перевода документов проверяет, соответствует ли термин глоссария в исходном тексте. Если регистр не соответствует, глоссарий не применяется.

  • Полное приложение предложения. Когда глоссарий применяется к полному предложению, служба становится нечувствительной к регистру. Он соответствует термину глоссария, независимо от его регистра, в исходном тексте. Этот атрибут помогает возвращать правильные результаты для вариантов использования с использованием идиом и кавычки.

Следующие шаги

Попробуйте руководство по переводу документов асинхронно переводить целые документы с помощью выбранного языка программирования: