阐明和限制选择

项目
06/13/2023

[Microsoft 代理从 Windows 7 开始已弃用，可能在后续版本的 Windows 中不可用。]

当用户学习相应语法范围时，语音识别会更加成功。当选项范围有限时，它也更有效。输入的开放式越少，语音引擎可以更好地分析声学信息输入。

Microsoft 代理包含多个内置预配，可提高语音输入的成功率。第一个是当用户说“打开命令窗口”或“我能说什么？” (或当用户从角色的弹出菜单中选择“打开命令窗口”) 时显示的命令窗口。命令窗口用作语音引擎的活动语法的视觉指南。它还通过仅激活输入活动应用程序的语音语法和 Microsoft 代理的全局命令来减少识别错误。因此，语音引擎的活动语法适用于即时上下文。有关命令窗口的详细信息，请参阅 Microsoft 代理编程接口概述。

创建启用 Microsoft 代理语音的命令时，可以创作出现在命令窗口中的描述文字文本及其语音文本 (语法) （引擎应用于匹配此命令的字词）。始终尝试使命令尽可能与众不同。命令（尤其是语音文本）的措辞差异越大，语音引擎就越有可能区分语音命令并提供准确的匹配。此外，请避免使用单字命令或非常短的命令。一般来说，口述话语中更多的声学信息使引擎有更好的机会进行准确的匹配。

定义命令的语音文本时，请提供合理的各种措辞。表示相同内容的请求的措辞可能大相径庭，如以下示例所示：

加入一些胡椒粉。

我想吃一些胡椒粉。

你能添加一些胡椒粉吗？

胡椒粉，请。

借助 Microsoft 代理，可以轻松地为应用程序的语音语法指定替代词或可选字词。将替代词或短语括在括号之间，用垂直条形字符分隔。可以通过将可选字词括在方括号字符之间来定义它们。还可以嵌套备用词或可选字词。此外，还可以在语音文本中使用省略号 (...) 作为任何单词的占位符。但是，过于频繁地使用省略号可能会使引擎更难区分不同的语音命令。在任何情况下，始终确保语音文本对于每个非可选命令至少包含一个独特的单词。通常，这应该与“命令窗口”中显示的描述文字文本中的单词匹配。

尽管可以在描述文字文本中包含符号、标点符号或缩写，但请避免在语音文本中使用它们。许多语音识别引擎无法处理符号和缩写，或者可能使用它们来设置特殊的输入参数。此外，请拼写数字。这也可确保更可靠的识别支持。

还可以使用指令提示来避免开放式输入。指令提示隐式引用选项或显式声明它们，如以下示例所示：

Prompt	计算
你想要什么？	过于常规，一个开放式请求
选择披萨样式或成分。	不错，如果选项可见，但仍一般
说“夏威夷人”、“芝加哥”或“工作”。	更好的是具有特定选项的显式指令

这将指导用户发出有效的命令。通过建议字词或短语，你更有可能引出预期的措辞来换取。若要避免非自然重复，请更改措辞或缩短原始内容，以便后续演示，因为用户对输入样式越来越有经验。当用户无法在规定时间内发出命令或无法提供预期的命令的情况下，也可以使用指令提示。可以使用语音输出和/或应用程序接口提供指令提示。关键是帮助用户了解适当的选择。

措辞会影响提示的成功。例如，提示“是否要订购披萨？” 可能会生成“是”或“否”响应，但也可能生成订单请求。将提示定义为不明确或准备接受更多可能的响应。此外，请注意人们模仿单词和构造他们听到的倾向。这通常用于帮助引发适当的响应，如以下示例所示：

用户： 给我看保罗的所有消息。

字符：

这更有可能引出其中一方的完整名称，其前缀可能为“我的意思是”或“我的意思是”。

由于 Microsoft 代理字符在 Microsoft Windows 的可视界面中运行，因此可以使用可视元素为语音输入提供指令提示。例如，可以在选项列表中设置字符手势，并请求用户选择一个选项，或在对话框或消息窗口中显示选项。这有两个好处：它明确建议你希望用户说话的字词，并为用户提供替代回复方式。

还可以使用其他交互模式巧妙地向用户推荐适当的语音语法，如以下示例所示：

用户： 使用鼠标 (单击夏威夷式披萨选项)

字符： 夏威夷风格的比萨饼。

用户： (使用鼠标单击“额外奶酪”选项)

字符： 添加“额外奶酪”。

成功语音输入的另一个重要因素是在引擎准备好输入时提示用户，因为许多语音引擎一次只允许一个话语。 Microsoft 代理通过两种方式对此提供支持。首先，如果声音卡支持 MIDI，Microsoft 代理会生成简短的音调，以在语音输入通道可用时发出信号。其次，当语音引擎) (字符正在侦听输入时，“侦听提示”窗口会显示相应的文本提示。此外，此提示还显示引擎听到的内容。

通过

阐明和限制选择

反馈

其他资源