你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

收集用户输入

项目
03/01/2024

随着 Azure 通信服务通话自动化识别操作的发布，开发人员现在可以增强其 IVR 或联系中心应用程序来识别用户输入。最常见的识别场景之一是向用户播放消息，这会提示他们提供一个答复，然后由应用程序识别，识别后，应用程序会执行相应的操作。可通过多种方式接收来自呼叫者的输入，包括 DTMF（用户通过呼叫设备上的数字输入）、语音或者 DTMF 和语音的组合。

使用语音转文本的语音识别

Azure 通信服务与 Azure AI 服务集成，让你能够通过识别操作实时分析音频，将语音转录为文本。现成的 Microsoft 功能利用通用语言模型作为一个基本模型（使用 Microsoft 自有数据进行训练），并反映常用的口语。此模型使用了代表各常见地域的方言和发音进行了预先训练。若要详细了解支持的语言，请参阅语音服务的语言和语音支持。

DTMF

双音多频 (DTMF) 识别是理解电话在按下数字时所生成的音调/声音的过程。接收端的设备侦听特定音调，然后将其转换为命令。在 IVR 方案中导航菜单时，这些命令通常表示用户意向，或者在某些情况下，可用于捕获用户需要通过其手机键盘提供的重要信息。

DTMF 事件及其关联音调

活动	语气
0	Zero
1	一个
2	两个
3	三级
4	四级
5	五级
6	六个
7	7
8	八个
9	9 个
A	A
B	B
C	C
D	D
*	星号
#	Pound

常见用例

识别操作可用于许多原因，下面是开发人员可如何在其应用程序中使用识别操作的几个示例。

使用自助服务提示改善用户历程

用户可以控制呼叫 - 通过启用输入识别，允许呼叫方导航 IVR 菜单并提供可用于解决其查询的信息。
收集用户信息 - 通过启用输入识别，应用程序可以收集来自呼叫方的输入。这可以是帐户号、信用卡信息等信息。
转录呼叫者答复 - 使用语音识别，你可以收集用户输入并将音频转录为文本，然后对其进行分析来执行特定的业务操作。

中断音频提示

用户可以从 IVR 菜单退出并与人工代理对话 - 通过 DTMF 中断，应用程序可允许用户中断 IVR 菜单的流，并能够与人工代理聊天。

在呼叫中使用语音识别收集用户输入的示例体系结构

在呼叫中收集用户输入的示例体系结构

识别动作

已知限制

不支持带内 DTMF，请转而使用 RFC 2833 DTMF。
文本转语音文本提示最多支持 400 个字符，如果你的提示超过此长度限制，建议对基于文本转语音的播放操作使用 SSML。
对于超出语音服务配额限制的场景，可按照此处概述的步骤请求调高此限制。

后续步骤

请查看我们的操作指南，了解如何收集用户输入。
了解呼叫自动化发布的使用情况和操作日志。

通过