配置语音功能

本文介绍了 for 互动语音响应 with Dynamics 365 客户服务中可用的 Copilot Studio 功能。

要为语音服务准备好代理,请参阅 将支持语音的代理与 Dynamics 365 客户服务集成

有关语音服务的概述,请参阅 在座席中使用互动语音响应

语音和 DTMF 模态

支持语音的代理与基于聊天的代理不同。 支持语音的代理包括用于处理语音场景的特定语音系统主题。 基于聊天的代理使用文本模态作为默认值。 语音启用的代理使用语音和 DTMF 模式。 这两种模态彼此不兼容。

Optimize for voice 允许您跨不同模式作者支持语音的代理,并确保正确创作与语音相关的功能。

针对语音进行优化

如果您没有使用 Voice 模板开始代理,则必须在代理 的 Settings(设置 )中启用 Optimize for voice(优化语音)选项。

  1. 打开代理后,转到 设置>语音

  2. 选择语音优化。 默认情况下,还设置使用语音作为主要创作模式选项。

当您启用 优化语音 和使用 语音作为主要创作模式 options 时,您的代理将获得以下更新:

  • 当从文本切换到语音和 DTMF 时创作语音功能的能力。
  • 将自动添加语音系统主题静音检测语音无法识别未知拨号盘按键,以处理语音相关的应用场景。
  • 使用代理数据 提高准确性(默认开启),从而提高语音识别准确性。
  • 现有的代理流(例如 主菜单 )没有变化主题以使用映射的 DTMF 触发器开始对话。

重要提示

  • 针对语音进行优化设置仅更改语音创作功能,不会更改渠道设置。 打开 Telephony(电话) 频道以获得完全支持语音的代理。
  • 此外,在最初未配置语音功能的代理上设置 Optimize for voice(优化语音 )意味着代理将没有 主菜单(预览版) 主题。 如果需要,您必须重新创建该主题。

禁用针对语音进行优化

如果未启用 Telephony 通道,则可以在代理创作中禁用 Optimize for voice(优化语音 )。 禁用针对语音进行优化后,您将获得以下更改:

  • 没有语音功能(如 DTMF 和插入)的代理创作。
  • 设置默认的文本模态。
  • 没有针对语音识别的改进,因为不提供语音识别。
  • 没有语音系统主题或全局 DTMF 主题。

    备注

    如果在其他主题中引用禁用的 DTMF 主题,则某些主题可能会在发布期间报告错误。

  • 您的代理流和渠道设置没有变化,因为禁用优化不会关闭 Telephony 渠道。
  • 启用或禁用 optimize for voice(针对语音 优化)选项在您发布代理后才会生效。 如果代理被意外启用或禁用并在模式之间切换,您有时间修复它。

重要提示

如果启用了 Telephony 通道,则禁用 “优化语音 ”可能会中断代理,因为所有 DTMF 触发器都会自动禁用。

使用语音作为主要创作模式

针对语音功能创作中的每个节点,应选择“语音和 DTMF”模态。 您可以将代理创作首选项选择为 使用语音作为主要创作模式。 此设置可确保所有输入字段都有正确的模态。 如果您已启用针对语音进行优化使用语音作为主要创作模式选项在默认情况下处于启用状态。

消息可用性

使用文本或语音模态会对您的渠道产生不同影响。

文本模态 语音模态 代理文本和语音频道
消息可用 消息为空 消息可用
消息为空 消息可用 消息不可用

自定义自动语音识别

特定域(例如医疗或金融)的支持语音的代理可能会看到用户使用金融术语或医学术语。 支持语音的代理很难将某些术语和行话从语音转换为文本。

若要确保能够准确识别语音输入,您可以改进语音识别:

  1. 打开代理后,选择 设置>语音

  2. 选择 使用代理数据 提高准确性,以启用代理的默认自定义自动语音识别设置。

  3. 选择保存提交更改。

  4. 发布您的代理以查看新的更改。

代理级语音选项参考

# 代理详细信息 设置页面允许您为各种语音相关功能配置超时。 在此页面中应用的设置将成为在代理中创建的主题的默认设置。

要更改代理级别超时选项,请执行以下操作:

  1. 打开代理后,选择 Settings>语音

    启用语音的代理的 Voice 设置的屏幕截图。

  2. 选择所需的设置,然后调整代理的默认设置。

  3. 选择保存提交更改。

代理级别设置

下表列出了每个选项以及它如何与节点级别设置相关。

支持语音的代理级别部分 设置 Description Default value 节点级别替代
DTMF 数位间超时 等待下一个 DTMF 键输入时允许的最大时间(毫秒)。 仅在用户不满足最大输入长度时,才应用多位数 DTMF 输入。 3000 毫秒 具有多位数 DTMF 输入的语音属性的问题节点
DTMF 终止超时 等待 DTMF 终止键的最大持续时间(毫秒)。 在用户达到最大输入长度并且未按终止键时应用限制。 仅适用于多位数 DTMF 输入。

在限制超时且终止 DTMF 密钥未到达后,代理结束识别并返回该指向的结果。

如果设置为“continue without waiting”,则代理不会等待终止键。 代理在用户输入最大长度后立即返回。
2000 毫秒 具有多位数 DTMF 输入的语音属性的问题节点
静默检测 静默检测超时 等待用户输入时允许的最大静音时间(毫秒)。 当代理未检测到任何用户输入时,限制适用。 默认值为“no silence timeout.”代理无限等待用户的输入。

语音静音检测对语音完成讲话后的时段进行计时。
无静音超时 具有多位数 DTMF 输入的语音属性的问题节点

系统主题(静音检测扳机键属性),用于 配置静音检测和超时
语音收集 言语结束超时 当用户在语音期间或之后暂停时应用限制。 如果 pause 超过超时限制,则代理假定用户说完。

语句结束超时的最大值为 3000 毫秒。 超过 3000 毫秒的任何语句都会缩短到 3000 毫秒。
1500 毫秒 具有语音属性的问题节点
语音收集 语音识别超时 确定代理允许用户在开始说话后输入的时间。 默认值为 12000 毫秒(大约 12 秒)。 无识别超时意味着无限时间。 代理会重新提示问题。 如果没有响应,语音将超过语音识别超时 12,000 毫秒 具有语音属性的问题节点
延迟消息 发送消息延迟 确定代理在后台操作请求启动后等待多长时间才能传送延迟消息。 以毫秒为单位设置时间。 500 毫秒 长时间运行操作的操作节点属性
延迟消息 最短播放时间 即使在播放消息时后台操作完成,延迟消息也会播放最短时间。 以毫秒为单位设置时间。 5000 毫秒 长时间运行操作的操作模式属性
言语敏感度 敏感度 控制系统如何平衡语音和背景噪音的检测。 降低对嘈杂环境、公共场所和免提操作的敏感度。 提高对安静环境、轻声细语用户或语音命令检测的灵敏度。 默认设置为 0.5。 0.5 此控件没有节点级覆盖。

启用打断

启用插入允许您的代理用户中断您的代理。 当您不需要代理用户听到整个消息时,此功能可能很有用。 例如,呼叫方可能已经知道菜单选项,因为他们过去听到过这些选项。 使用 barge-in,代理用户可以输入他们想要的选项,即使代理没有列出所有选项。

打断禁用应用场景

  • 如果您最近更新了代理消息,或者合规性消息不应中断,请禁用插入。
  • 对第一条代理消息禁用插入,以确保代理用户了解新的或必要的信息。

规格

  • 插入支持来自代理用户的基于 DTMF 和基于语音的中断。

  • 可以使用每个消息在一个批处理任务中控制打断。 在允许打断的每个节点之前按顺序放置 barge-in-disabled 节点。 否则,打断已禁用将被视为 allow-barge-in 消息。

    消息节点中的打断和打断已禁用放置的屏幕截图。

    完成一个批处理队列后,将针对下一个批处理重置打断自动设置,并且该设置在每个后续消息中由打断标志控制。 当序列再次启动时,您可以放置打断已禁用节点。

小费

如果有连续的消息节点,后跟问题节点,则这些节点的语音消息将定义为一个批处理。 一个批次从 message 节点开始,在 question 节点停止,该节点正在等待用户的输入。

避免对冗长的消息禁用插入,尤其是当您预计代理用户经常与代理交互时。 如果您的代理用户已经知道菜单选项,请让他们在他们想去的地方自助服务。

设置打断

  1. 选择消息问题节点后,将所需模态设置为语音和 DTMF

  2. 选择节点的更多图标 (),然后选择属性

    1. 对于消息节点,将在创作画布的一侧打开发送活动属性面板。

      选择允许打断

    2. 对于问题节点,将打开问题属性面板,然后选择语音

      语音属性中,选择允许打断

  3. 保存主题以提交您的更改。

配置静音检测和超时

静默检测允许您配置代理等待用户输入的时间,以及如果未收到输入时采取的操作。 静默检测在节点级别回复问题时或代理等待触发短语开始新主题时最有用。

您可以为主题配置 默认超时

若要替代节点的默认值:

  1. 选择节点的更多图标 (),然后选择属性

    将打开问题属性面板。

  2. 选择语音,然后对以下设置进行调整:

    静音检测超时选项 Description
    使用代理设置 Node 使用 全局设置 进行静默检测。
    对此节点禁用 代理无限期地等待回复。
    自定义时间(毫秒) 代理会等待指定的时间,然后再重复问题。

回退操作

您可以将某些行为配置为回退操作:

  • 代理应该重复问题多少次
  • 重新提示消息应包含哪些内容
  • 代理在指定重复次数后应该做什么

语音输入

对于语音输入,您可以指定:

  • 话语结束超时:用户说完后代理等待的时间
  • 语音识别超时:代理在用户开始响应后为用户提供的时间

要在代理等待触发短语时配置静默检测行为,调整 On silence(静默 时系统主题)中的 设置。

为长时间运行操作添加延迟消息

对于较长的后端操作,您的代理可以向用户发送消息,通知他们较长的流程。 消息传送通道上的代理也可以发送延迟消息。

延迟消息音频播放 聊天中的延迟消息
继续循环播放,直到操作完成。 仅在达到指定延迟时发送一次。

In Copilot Studio 中,您的代理可以在触发 Power Automate 流后重复一条消息:

  1. 添加触发流的 Action 节点。

  2. 选择节点的更多图标 (),然后选择属性。 将打开操作属性面板。

  3. 选择发送消息

  4. 在 Message(消息 部分中,输入您希望代理说的内容。 您可以使用 SSML 修改消息的声音。 代理重复该消息,直到流完成。

您可以在 Delay 部分下 调整代理在重复消息之前应等待多长时间。 即时流完成,您也可以设置最小等待时间。

配置通话终止

要将代理配置为结束通话并挂断,请添加一个新节点(+),然后选择 主题 management>结束对话

突出显示了“主题管理”和“结束对话”的新节点菜单的屏幕截图。

使用 SSML 设置语音合成格式

您可以使用语音合成标记语言(SSML)来更改代理在大声朗读消息时的声音。 例如,您可以更改口语的音调或频率、语速和音量。

与 HTML 类似,SSML 使用标记将要修改的文本括在一起。 您可以在 Copilot Studio 中使用以下标记:

SSML 标记 Description 链接到语音服务文档
<audio src="_URL to an audio file_"/> 在标记内添加指向音频文件的 URL。 该文件必须可由代理用户访问。 添加录制的音频
<break /> 在单词之间插入停顿或中断。 在标记内插入中断选项。 添加中断
<emphasis>要修改的文本</emphasis> 为单词或短语添加重音级别。 在开始标记中添加强调选项。 在要修改的文本后添加结束标记。 调整强调选项
<prosody>要修改的文本</prosody> 指定对音调、音调线、范围、速率和音量所做的更改。 在开始标记中添加韵律选项。 在要修改的文本后添加结束标记。 调整韵律选项
<lang xml:lang="xx-XX">要修改的文本</lang> 使用多语言神经语音时,调整同一消息中的朗读语言。 调整口语

添加了 SSML 标记的语音消息的屏幕截图。

查找和使用标记

像 HTML 一样,SSML 使用标记将要修改的文本括在一起。

您可以在 Copilot Studio 中使用以下标记:

  1. 选择消息问题节点后,将模式更改为语音和 DTMF

  2. 选择 SSML 标记菜单,然后选择标记。

    用标记填充消息框。 如果消息框中已有文本,将在消息末尾追加标记的代码。

  3. 在要修改的文本周围添加开始和结束标记。 您可以组合多个标记,然后使用单独的标记自定义消息的各个部分。

小费

您可以手动输入未出现在帮助程序菜单中的 SSML 标记。 要了解有关您可以使用的其他标记的详细信息,请参阅使用语音合成标记语言改进合成

将呼叫转接到代表或外部电话号码

您可以使用代理转移呼叫外部电话号码。 Copilot Studio 支持无条件转接到 PSTN 电话号码和直接路由号码。

若要转接到外部电话号码:

  1. 在要修改的主题中,添加新节点 (+)。 在节点菜单中,选择主题管理,然后选择转接对话

  2. 转接类型下,,选择外部电话号码转接,然后输入转接号码。

  3. (可选)将 SIP UUI 标头添加到电话联络。

    此标头是 key=value 对的字符串,没有空格或特殊字符,已显示以供外部系统读取。

    1. 选择节点的更多图标 (),然后选择属性。 将打开转接对话属性面板。

    2. SIP UUI 标头下,输入要通过呼叫转移发送的信息。 当转接到外部电话号码时,不支持变量。

    注意

    仅发送字符串中的前 128 个字符。

    该标头仅接受数字、字母、等号 (=) 和分号 (;)。 包括空格、花括号、圆括号或公式在内的所有其他字符均不受支持,它们可能会导致转接失败。

小费

针对相应的国家/地区代码,在电话号码中包括 +

目标电话号码的具有 SIP UUI 的转出必须使用直接路由公用电话交换网 (PSTN) 电话号码不支持 SIP UUI 标头转接。

要转移到代表,请参阅 显式触发器

使用语音变量

Copilot Studio 支持变量填充。 您可以使用预定义的变量,也可以创建自定义变量。

备注

  • 有关如何在 Copilot Studio 中使用和创建变量的更多信息,请参见使用变量
  • 有关支持语音的代理可用的其他活动和对话变量的信息,请参阅 支持语音的代理的变量。

支持语音的代理支持 Copilot Studio 上下文变量。 这些变量可帮助您在转接呼叫时将代理对话与 Dynamics 365 客户服务集成。

有关 Dynamics 365 客户服务中的上下文变量的更多信息,请参阅 机器人的 Copilot Studio 上下文变量。

当您转移时,此集成支持这些具有以下变量的方案:

变量 类型​​ Description
System.Activity.From.Name String 代理用户的呼叫方 ID
System.Activity.Recipient.Name String 用于呼叫或连接代理
System.Conversation.SipUuiHeaderValue String 通过直接路由电话号码转接时的 SIP 标头值
System.Activity.UserInputType String 代理用户在对话中使用了 DTMF 还是语音
System.Activity.InputDTMFKey String 代理用户的原始 DTMF 输入
System.Conversation.OnlyAllowDTMF 布尔型 当设置为 true 时,语音忽略语音输入
System.Activity.SpeechRecognition.Confidence 数字 来自上次语音识别事件的置信度值(介于 0 和 1 之间)
System.Activity.SpeechRecognition.MinimalFormattedText String 在 Copilot Studio 应用其专用自然语言理解模型之前的语音识别结构(作为原始文本)

备注

  • 具有大型扳机键短语和实体大小的代理需要更长的时间来发布。
  • 如果多个用户同时发布相同的代理,则您的发布操作将被阻止。 您需要在其他人完成现有的代理编辑后重新发布代理。

要了解有关发布基础知识的更多信息,请参阅 关键概念 - 发布和部署代理