你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

收集用户输入

随着 Azure 通信服务通话自动化识别操作的发布,开发人员现在可以增强其 IVR 或联系中心应用程序来识别用户输入。 最常见的识别场景之一是向用户播放消息,这会提示他们提供一个答复,然后由应用程序识别,识别后,应用程序会执行相应的操作。 可通过多种方式接收来自呼叫者的输入,包括 DTMF(用户通过呼叫设备上的数字输入)、语音或者 DTMF 和语音的组合。

使用语音转文本的语音识别

Azure 通信服务与 Azure AI 服务集成,让你能够通过识别操作实时分析音频,将语音转录为文本。 现成的 Microsoft 功能利用通用语言模型作为一个基本模型(使用 Microsoft 自有数据进行训练),并反映常用的口语。 此模型使用了代表各常见地域的方言和发音进行了预先训练。 若要详细了解支持的语言,请参阅语音服务的语言和语音支持

DTMF

双音多频 (DTMF) 识别是理解电话在按下数字时所生成的音调/声音的过程。 接收端的设备侦听特定音调,然后将其转换为命令。 在 IVR 方案中导航菜单时,这些命令通常表示用户意向,或者在某些情况下,可用于捕获用户需要通过其手机键盘提供的重要信息。

DTMF 事件及其关联音调

活动 语气
0 Zero
1 一个
2 两个
3 三级
4 四级
5 五级
6 六个
7 7
8 八个
9 9 个
A A
B B
C C
D D
* 星号
# Pound

常见用例

识别操作可用于许多原因,下面是开发人员可如何在其应用程序中使用识别操作的几个示例。

使用自助服务提示改善用户历程

  • 用户可以控制呼叫 - 通过启用输入识别,允许呼叫方导航 IVR 菜单并提供可用于解决其查询的信息。
  • 收集用户信息 - 通过启用输入识别,应用程序可以收集来自呼叫方的输入。 这可以是帐户号、信用卡信息等信息。
  • 转录呼叫者答复 - 使用语音识别,你可以收集用户输入并将音频转录为文本,然后对其进行分析来执行特定的业务操作。

中断音频提示

用户可以从 IVR 菜单退出并与人工代理对话 - 通过 DTMF 中断,应用程序可允许用户中断 IVR 菜单的流,并能够与人工代理聊天。

在呼叫中使用语音识别收集用户输入的示例体系结构

此图显示识别 AI 操作的示例体系结构。

在呼叫中收集用户输入的示例体系结构

识别动作

已知限制

  • 不支持带内 DTMF,请转而使用 RFC 2833 DTMF。
  • 文本转语音文本提示最多支持 400 个字符,如果你的提示超过此长度限制,建议对基于文本转语音的播放操作使用 SSML。
  • 对于超出语音服务配额限制的场景,可按照此处概述的步骤请求调高此限制。

后续步骤