Поделиться через


Нейронный словарь Azure AI Translator

Нейронный словарь Azure AI Translator — это расширение возможностей динамического словаря и словаря фраз. Динамические и словари фраз позволяют настраивать выходные данные перевода, предоставляя собственные переводы для определенных терминов или фраз. Нейронный словарь улучшает качество перевода предложений, которые включают один или несколько терминов перевода, позволяя модели машинного перевода настраивать как термин, так и контекст.

Основные функции нейронного словаря

  • Более высокая точность перевода по сравнению с словарями фраз, которые полагаются на точный метод find-and-replace.

  • Более текучие переводы для предложений, которые включают один или несколько терминов перевода.

  • Общая высокая точность перевода.

  • Нейронная фраза, которая эффективно обрабатывает глаголы, прилагательные и существительные фразы. Оба источника и целевого объекта должны иметь одинаковые теги с частью речи (синтаксис).

В следующей таблице перечислены различия между исправлением стандартной и нейронной фразы:

Исправление стандартной фразы Исправление нейронной фразы
Точную операцию поиска и замены. Запрошенный перевод отображается в выходных данных в том же формате. Запрошенный перевод можно изменить или изменить регистр.
Предполагается, что запрошенный перевод является точным переводом. Запрошенный перевод, как ожидается, будет находиться в форме lemma (word base).
Фраза применяется только в том случае, если исходная часть отображается в тексте в той же форме (нет разницы). Фраза применяется только в том случае, если исходная часть отображается в тексте в той же форме (нет разницы).
Можно надежно использовать для копирования. Невозможно надежно использовать для копирования.
Работает наиболее эффективно с существительными. Эффективно работает с существительными, глаголами, прилагательными и существительными фразами.

Поддерживаемые языки

Ниже перечислены текущие поддерживаемые языковые пары нейронного словаря :

Оригинал Target
Китайский (упрощенный) (zh-cn) Английский (en-us)
Английский (en-us) Китайский (упрощенный) (zh-cn)
Английский (en-us) Французский (fr-fr)
Английский (en-us) Немецкий (de-de)
Английский (en-us) Итальянский (it-it)
Английский (en-us) Японский (ja-jp)
Английский (en-us) Корейский (ko-kr)
Английский (en-us) Польский (pl-pl)
Английский (en-us) Русский (ru-ru)
Английский (en-us) Испанский (es-es)
Английский (en-us) Шведский (sv-se)
Французский (fr-fr) Английский (en-us)
Немецкий (de-de) Английский (en-us)
Итальянский (it-it) Английский (en-us)
Японский (ja-jp) Английский (en-us)
Корейский (ko-kr) Английский (en-us)
Польский (pl-pl) Английский (en-us)
Русский (ru-ru) Английский (en-us)
Испанский (es-es) Английский (en-us)
Шведский (sv-se) Английский (en-us)

Включение нейронного словаря

Нейронный словарь доступен с помощью пользовательской платформы переводчика с словарями фраз для всех поддерживаемых языков. Для включения нейронного словаря требуется полная переобучение пользовательской модели (или только словарь).

Инструкции и рекомендации

  • Запись из словаря фраз применяется только в том случае, если исходный элемент найден с помощью точного совпадения с учетом регистра. Это действие применяется как к исправлению жесткой, так и нейронной фразы.

    • При работе с словарем для исправления нейронной фразы, чтобы убедиться, что запись словаря фраз применяется согласованно, рекомендуется добавлять записи фраз с источником в различных формах.

    • Например, если вы хотите убедиться, что "решение" переведено как "alternatywa" (польский перевод слова "альтернатива") рядом solution _ alternatywa с вы можете добавить следующие записи: Solution _ alternatywa, , solutions _ alternatywy. Solutions _ alternatywy

  • Если вы используете словарь фраз, чтобы убедиться, что определенное слово или фраза копируется из входного текста в выходной перевод, рассмотрите возможность применения подробного словаря для повышения согласованности.  Копирование "как есть" не гарантируется с помощью словаря нейронных фраз, так как он может изменить слова или изменить регистр. Однако он может копировать именованные сущности и акронимы.

  • Исправление нейронной фразы не применяется для предложений, содержащих по крайней мере один из следующих элементов: эмодзи, смайлик, URL-адрес, идентификатор социальных сетей, идентификатор кода, математические символы или длинные последовательности чисел, такие как шестнадцатеричное.

  • Редко (менее 0,1%), исправление нейронной фразы не учитывает запись динамического словаря или словаря фраз, и запрошенный перевод не отображается в выходном переводе.

  • Избегайте добавления переводов общих или частых слов или фраз в словарь фраз.

Следующие шаги

Дополнительные сведения см. в руководстве по Azure AI Custom Translator.