你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
收集用户输入
随着 Azure 通信服务通话自动化识别操作的发布,开发人员现在可以增强其 IVR 或联系中心应用程序来识别用户输入。 最常见的识别场景之一是向用户播放消息,这会提示他们提供一个答复,然后由应用程序识别,识别后,应用程序会执行相应的操作。 可通过多种方式接收来自呼叫者的输入,包括 DTMF(用户通过呼叫设备上的数字输入)、语音或者 DTMF 和语音的组合。
使用语音转文本的语音识别
Azure 通信服务与 Azure AI 服务集成,让你能够通过识别操作实时分析音频,将语音转录为文本。 现成的 Microsoft 功能利用通用语言模型作为一个基本模型(使用 Microsoft 自有数据进行训练),并反映常用的口语。 此模型使用了代表各常见地域的方言和发音进行了预先训练。 若要详细了解支持的语言,请参阅语音服务的语言和语音支持。
DTMF
双音多频 (DTMF) 识别是理解电话在按下数字时所生成的音调/声音的过程。 接收端的设备侦听特定音调,然后将其转换为命令。 在 IVR 方案中导航菜单时,这些命令通常表示用户意向,或者在某些情况下,可用于捕获用户需要通过其手机键盘提供的重要信息。
DTMF 事件及其关联音调
活动 | 语气 |
---|---|
0 | Zero |
1 | 一个 |
2 | 两个 |
3 | 三级 |
4 | 四级 |
5 | 五级 |
6 | 六个 |
7 | 7 |
8 | 八个 |
9 | 9 个 |
A | A |
B | B |
C | C |
D | D |
* | 星号 |
# | Pound |
常见用例
识别操作可用于许多原因,下面是开发人员可如何在其应用程序中使用识别操作的几个示例。
使用自助服务提示改善用户历程
- 用户可以控制呼叫 - 通过启用输入识别,允许呼叫方导航 IVR 菜单并提供可用于解决其查询的信息。
- 收集用户信息 - 通过启用输入识别,应用程序可以收集来自呼叫方的输入。 这可以是帐户号、信用卡信息等信息。
- 转录呼叫者答复 - 使用语音识别,你可以收集用户输入并将音频转录为文本,然后对其进行分析来执行特定的业务操作。
中断音频提示
用户可以从 IVR 菜单退出并与人工代理对话 - 通过 DTMF 中断,应用程序可允许用户中断 IVR 菜单的流,并能够与人工代理聊天。
在呼叫中使用语音识别收集用户输入的示例体系结构
在呼叫中收集用户输入的示例体系结构
已知限制
- 不支持带内 DTMF,请转而使用 RFC 2833 DTMF。
- 文本转语音文本提示最多支持 400 个字符,如果你的提示超过此长度限制,建议对基于文本转语音的播放操作使用 SSML。
- 对于超出语音服务配额限制的场景,可按照此处概述的步骤请求调高此限制。