阐明和限制选择
[Microsoft 代理从 Windows 7 开始已弃用,可能在后续版本的 Windows 中不可用。]
当用户学习相应语法范围时,语音识别会更加成功。 当选项范围有限时,它也更有效。 输入的开放式越少,语音引擎可以更好地分析声学信息输入。
Microsoft 代理包含多个内置预配,可提高语音输入的成功率。 第一个是当用户说“打开命令窗口”或“我能说什么?” (或当用户从角色的弹出菜单中选择“打开命令窗口”) 时显示的命令窗口。 命令窗口用作语音引擎的活动语法的视觉指南。 它还通过仅激活输入活动应用程序的语音语法和 Microsoft 代理的全局命令来减少识别错误。 因此,语音引擎的活动语法适用于即时上下文。 有关命令窗口的详细信息,请参阅 Microsoft 代理编程接口概述。
创建启用 Microsoft 代理语音的命令时,可以创作出现在命令窗口中的描述文字文本及其语音文本 (语法) (引擎应用于匹配此命令的字词)。 始终尝试使命令尽可能与众不同。 命令(尤其是语音文本)的措辞差异越大,语音引擎就越有可能区分语音命令并提供准确的匹配。 此外,请避免使用单字命令或非常短的命令。 一般来说,口述话语中更多的声学信息使引擎有更好的机会进行准确的匹配。
定义命令的语音文本时,请提供合理的各种措辞。 表示相同内容的请求的措辞可能大相径庭,如以下示例所示:
加入一些胡椒粉。
我想吃一些胡椒粉。
你能添加一些胡椒粉吗?
胡椒粉,请。
借助 Microsoft 代理,可以轻松地为应用程序的语音语法指定替代词或可选字词。 将替代词或短语括在括号之间,用垂直条形字符分隔。 可以通过将可选字词括在方括号字符之间来定义它们。 还可以嵌套备用词或可选字词。 此外,还可以在语音文本中使用省略号 (...) 作为任何单词的占位符。 但是,过于频繁地使用省略号可能会使引擎更难区分不同的语音命令。 在任何情况下,始终确保语音文本对于每个非可选命令至少包含一个独特的单词。 通常,这应该与“命令窗口”中显示的描述文字文本中的单词匹配。
尽管可以在描述文字文本中包含符号、标点符号或缩写,但请避免在语音文本中使用它们。 许多语音识别引擎无法处理符号和缩写,或者可能使用它们来设置特殊的输入参数。 此外,请拼写数字。 这也可确保更可靠的识别支持。
还可以使用指令提示来避免开放式输入。 指令提示隐式引用选项或显式声明它们,如以下示例所示:
Prompt | 计算 |
---|---|
你想要什么? | 过于常规,一个开放式请求 |
选择披萨样式或成分。 | 不错,如果选项可见,但仍一般 |
说“夏威夷人”、“芝加哥”或“工作”。 | 更好的是具有特定选项的显式指令 |
这将指导用户发出有效的命令。 通过建议字词或短语,你更有可能引出预期的措辞来换取。 若要避免非自然重复,请更改措辞或缩短原始内容,以便后续演示,因为用户对输入样式越来越有经验。 当用户无法在规定时间内发出命令或无法提供预期的命令的情况下,也可以使用指令提示。 可以使用语音输出和/或应用程序接口提供指令提示。 关键是帮助用户了解适当的选择。
措辞会影响提示的成功。 例如,提示“是否要订购披萨?” 可能会生成“是”或“否”响应,但也可能生成订单请求。 将提示定义为不明确或准备接受更多可能的响应。 此外,请注意人们模仿单词和构造他们听到的倾向。 这通常用于帮助引发适当的响应,如以下示例所示:
用户: 给我看保罗的所有消息。
字符:
这更有可能引出其中一方的完整名称,其前缀可能为“我的意思是”或“我的意思是”。
由于 Microsoft 代理字符在 Microsoft Windows 的可视界面中运行,因此可以使用可视元素为语音输入提供指令提示。 例如,可以在选项列表中设置字符手势,并请求用户选择一个选项,或在对话框或消息窗口中显示选项。 这有两个好处:它明确建议你希望用户说话的字词,并为用户提供替代回复方式。
还可以使用其他交互模式巧妙地向用户推荐适当的语音语法,如以下示例所示:
用户: 使用鼠标 (单击夏威夷式披萨选项)
字符: 夏威夷风格的比萨饼。
用户: (使用鼠标单击“额外奶酪”选项)
字符: 添加“额外奶酪”。
成功语音输入的另一个重要因素是在引擎准备好输入时提示用户,因为许多语音引擎一次只允许一个话语。 Microsoft 代理通过两种方式对此提供支持。 首先,如果声音卡支持 MIDI,Microsoft 代理会生成简短的音调,以在语音输入通道可用时发出信号。 其次,当语音引擎) (字符正在侦听输入时,“侦听提示”窗口会显示相应的文本提示。 此外,此提示还显示引擎听到的内容。