倾听,不要只识别

[Microsoft 代理从 Windows 7 开始已弃用,可能在后续版本的 Windows 中不可用。]

成功的沟通不仅仅是对单词的识别。 对话过程意味着交换线索,以发出转向和理解的信号。 字符可以通过提供头部倾斜、点头或摇动等提示来指示语音引擎何时处于聆听状态以及何时识别某些内容,从而改善对话界面。 例如,当用户按下按即讲侦听键时,Microsoft 代理将播放分配给 侦听 状态的动画,并在检测到言语时播放分配给 听力 状态的动画。 定义自己的角色时,请确保创建相应的动画并将其分配给这些状态。 有关设计字符的详细信息,请参阅 为 Microsoft 代理设计字符

除了非语言提示外,谈话还涉及对话各方之间的共同背景。 同样,使用字符的语音输入方案在上下文建立良好时更有可能成功。 建立上下文可以更好地解释类似短语,例如“邮件中的检查”和“检查我的邮件”。你可能还希望通过提供命令(例如“帮助”或“我在哪里”)来使用户能够查询上下文,通过重述当前上下文(例如应用程序执行的最后一个操作)来响应该命令。

Microsoft 代理提供的接口使你能够访问语音识别引擎返回的最佳匹配项和两个下一个最佳替代方案。 此外,还可以访问所有匹配项的置信度分数。 可以使用此信息更好地确定所讲的内容。 例如,如果最佳匹配项和第一个替代项的置信度分数接近,则可能表明语音引擎难以辨别它们之间的差异。 在这种情况下,可能需要要求用户重复或重新创建请求,以提高性能。 但是,如果最佳匹配项和第一个或第二个替代项返回相同的命令,则会加强正确识别的指示。

对话或对话的性质意味着应对语音输入做出响应。 因此,应始终使用指示已执行的操作或遇到问题的口头或视觉反馈来响应用户的输入,或者提供适当的答复。