你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

呼叫中心概述

Azure AI 语言和 Azure AI 语音有助于实现基于电话服务的客户交互的部分或完全自动化,并提供跨多个渠道的辅助功能。 借助语言和语音服务,可以进一步分析呼叫中心口述文本、提取和编修对话 (PII)、总结口述文本并检测情绪。

在呼叫和联系中心实现 Azure AI 服务的某些示例方案包括:

  • 虚拟代理:基于对话 AI 的电话服务集成语音机器人和启用语音的聊天机器人
  • 代理助手:实时听录和分析呼叫,通过向代理提供见解和建议操作来提升客户体验
  • 呼叫后分析:呼叫后分析用于创建对客户对话的见解,从而增进了解并支持呼叫处理的持续改进、质量保证和合规性控制的优化以及其他见解驱动的优化。

提示

请尝试访问 Language StudioSpeech Studio,通过演示了解如何使用语言和语音服务分析呼叫中心对话。

若要使用无代码方法将呼叫中心听录解决方案部署到 Azure,请尝试引入客户端

适用于呼叫中心的 Azure AI 服务功能

整体呼叫中心实现通常包含来自语言和语音服务的技术。

通常情况下,呼叫中心使用的音频数据(通过座机、移动电话和无线电生成)是窄带的,处于 8 KHz 范围内,在执行语音转文本过程中会带来挑战。 语音服务识别模型经过训练,可确保获取高质量的口述文本,但你选择捕获音频。

使用语音服务听录音频后,就可以使用语言服务对呼叫中心数据执行分析,例如:情绪分析、总结客户呼叫的原因、解决方式、提取和编修对话 PII 等。

语音服务

语音服务提供以下可用于呼叫中心用例的功能:

  • 实时语音转文本:实时识别和听录来自多个输入的音频。 例如,借助虚拟代理或代理助手,可以持续识别音频输入并控制如何基于多个事件处理结果。
  • 批量语音转文本:异步听录大量音频文件(包括说话人分割聚类在内),通常用于呼叫后分析场景。 分割聚类是在单声道音频数据中识别和分离说话人的过程。
  • 文本转语音:文本转语音使应用程序、工具或设备能够将文本转换为类似人类的合成语音。
  • 说话人识别:有助于确定一组登记的说话人中未知说话人的标识,通常用于呼叫中心客户验证方案或欺诈检测。
  • 语言识别:识别音频中所说的语言,可用于实时分析和呼叫后分析,从而获取见解或控制环境(例如虚拟代理的输出语言)。

语音服务能够很好地与预生成模型配合工作。 但是,建议根据自己的产品或环境,进一步自定义和优化体验。 语音自定义的典型示例包括:

语音自定义 说明
自定义语音 使用的语音转文本功能评估和提高用例特定实体(例如字母数字客户、案例和合同 ID、牌照和名称)的语音识别准确度。 还可以使用你自己的产品名和行业术语训练自定义模型。
神经网络定制声音 一种文本转语音功能,使你可以为应用程序创建独一无二的定制合成声音。

语言服务

语言服务提供以下可用于呼叫中心用例的功能:

虽然语言服务可以很好地与预生成模型配合使用,但你可能希望进一步自定义和调整模型,以便从数据中提取更多信息。 语言自定义的典型示例包括:

语言自定义 说明
自定义 NER(命名实体识别) 改进口述文本中实体的检测和提取。
自定义文本分类 使用单个或多个分类对听录的语句进行分类和标记。

可以在此处找到所有语言服务功能和自定义选项的概述。

后续步骤