你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
神经网络字典
神经网络字典是动态字典和短语字典功能的扩展。 动态字典和短语字典都允许你通过为特定术语或短语提供你自己的翻译来自定义翻译输出。 神经网络字典通过让机器翻译模型调整术语和上下文来提高包含一个或多个术语翻译的句子的翻译质量。
神经网络字典的关键功能
与依赖精确查找和替换方法的短语字典相比,翻译准确性更高。
包含一个或多个术语翻译的句子的翻译更加流畅。
术语翻译总体准确度较高。
神经网络短语修复可有效处理动词、形容词和名词短语。 源和目标必须具有相同的词性(语法)标记。
下表列出了标准短语修复和神经网络短语修复之间的差异:
标准短语修复 | 神经网络短语修复 |
---|---|
精确的查找和替换操作。 请求的翻译以完全相同的格式显示在输出中。 | 请求的翻译可以进行变形或进行大小写更改。 |
假定请求的翻译是准确的翻译。 | 请求的翻译应采用词根(词基)形式。 |
仅当源部分以完全相同的形式(无差异)出现在文本中时才应用该短语。 | 仅当源部分以完全相同的形式(无差异)出现在文本中时才应用该短语。 |
可以可靠地用于复制。 | 无法可靠地用于复制。 |
最适合与名词一起使用。 | 可与名词、动词、形容词和名词短语一起使用。 |
支持的语言
下表列出了当前支持的神经网络字典语言对:
Source | 目标 |
---|---|
简体中文 (zh-cn ) |
英语 (en-us ) |
英语 (en-us ) |
简体中文 (zh-cn ) |
英语 (en-us ) |
法语 (fr-fr ) |
英语 (en-us ) |
德语 (de-de ) |
英语 (en-us ) |
意大利语 (it-it ) |
英语 (en-us ) |
日语 (ja-jp ) |
英语 (en-us ) |
韩语 (ko-kr ) |
英语 (en-us ) |
波兰语 (pl-pl ) |
英语 (en-us ) |
俄语 (ru-ru ) |
英语 (en-us ) |
西班牙语 (es-es ) |
英语 (en-us ) |
瑞典语 (sv-se ) |
法语 (fr-fr ) |
英语 (en-us ) |
德语 (de-de ) |
英语 (en-us ) |
意大利语 (it-it ) |
英语 (en-us ) |
日语 (ja-jp ) |
英语 (en-us ) |
韩语 (ko-kr ) |
英语 (en-us ) |
波兰语 (pl-pl ) |
英语 (en-us ) |
俄语 (ru-ru ) |
英语 (en-us ) |
西班牙语 (es-es ) |
英语 (en-us ) |
瑞典语 (sv-se ) |
英语 (en-us ) |
启用神经网络字典
神经网络字典可使用自定义翻译工具平台,该平台包含所有支持的语言的短语字典。 需要重新训练完整(或仅字典)自定义模型才能启用神经网络字典。
指导和建议
仅当通过精确区分大小写的匹配找到源元素时,才会应用短语字典中的条目。 此操作适用于硬短语和神经网络短语修复。
使用神经网络短语修复字典时,请考虑以各种形式添加带有源的短语条目,以确保一致地应用短语字典条目。
例如,如果希望确保
solution _ alternatywa
旁边的“solution”被翻译为“alternatywa”(英语单词“alternative”的波兰语翻译),还可以添加以下条目:Solution _ alternatywa
、solutions _ alternatywy
、Solutions _ alternatywy
。
如果使用短语字典来确保将特定单词或短语“按原样”从输入文本复制到输出翻译,请考虑强制使用逐字字典以获得更高的一致性。 神经网络短语字典不能保证“按原样”复制,因为它可能会进行词形变化或大小写更改。 但它可以复制命名实体和首字母缩略词。
神经网络短语修复不适用于至少包含以下元素之一的句子:表情符号、颜文字、URL、社交媒体标识符、代码标识符、数学符号或长数字序列(例如十六进制)。
神经网络短语修复通常会考虑动态字典注释或短语字典条目,并且请求的翻译也会出现在输出翻译中,只有很少情况不这样(概率小于 0.1%)。
避免将常见或频繁出现的单词或短语的翻译添加到短语字典中。
后续步骤
若要了解详细信息,请从自定义翻译工具初学者指南开始。