你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
向专业声音项目添加发音人同意
配音员是个人或目标说话人,其语音会被录制下来并用于创建神经语音模型。
在训练神经语音之前,必须提交发音人录制的的同意声明。 发音人声明是发音人读出同意使用其语音数据来训练自定义语音模型的声明并录制下来。 同意声明还用于验证发音人是否为训练数据中的说话人。
提示
在开始使用 Speech Studio 之前,请定义语音角色并选择合适的发音人。
可在 GitHub 上找到多种语言的发音人同意声明。 口头陈述的语言必须与录制内容相同。 另请参阅针对发音人的披露内容。
添加发音人
若要添加发音人资料并上传其同意声明,请执行以下步骤:
- 登录 Speech Studio。
- 选择“定制声音”>“你的项目名称”>“设置发音人”>“添加发音人”。
- 在“添加新的发音人”向导中,说明要创建的语音的特征。 在此处指定的方案必须符合你在申请表单中提供的内容。
- 选择“下一步” 。
- 在“上传发音人声明”页上,按照说明上传事先录制好的发音人声明。 请务必采用训练数据时的设置、环境和说话风格来录制发音人声明。
- 输入发音人姓名和公司名称。 发音人姓名必须是录制同意声明的人员的姓名。 使用与录制的声明相同的语言输入名称。 公司名称必须与录制的声明中说出的公司名称匹配。 确保输入的公司名称与录制的声明使用相同的语言。
- 选择下一步。
- 查看发音人和角色详细信息,然后选择“提交”。
发音人状态显示为“成功”后,即可继续训练自定义语音模型。
后续步骤
使用专业声音功能时,在创建每段语音之前都必须经得用户的明确同意。 需要用户提供录制的声明,确认客户(Azure AI 语音资源所有者)将创建并使用他们的声音。
要将发音人同意添加到专业声音项目中,可以从可公开访问的 URL (Consents_Create) 获取预先录制的同意音频文件或上传音频文件 (Consents_Post)。 在本文中,将从 URL 添加同意。
同意声明
你需要用户说出同意声明的录音。
可以从文本转语音 GitHub 存储库获取每个区域设置的同意声明文本。 有关 en-US
区域设置的同意声明,请参阅 SpeakerAuthorization.txt:
"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
从 URL 添加同意
要从音频文件的 URL 添加对专业声音项目的同意,请使用定制声音 API 的 Consents_Create 操作。 根据以下说明构造请求正文:
- 设置所需的
projectId
属性。 请参阅创建项目。 - 设置所需的
voiceTalentName
属性。 发音人姓名必须是录制同意声明的人员的姓名。 使用与录制的声明相同的语言输入名称。 以后无法更改发音人姓名。 - 设置所需的
companyName
属性。 公司名称必须与录制的声明中说出的公司名称匹配。 确保输入的公司名称与录制的声明使用相同的语言。 以后无法更改公司名称。 - 设置所需的
audioUrl
属性。 发音人同意音频文件的 URL。 使用包含共享访问签名 (SAS) 令牌的 URI。 - 设置所需的
locale
属性。 这应是同意的区域设置。 以后无法更改此区域设置。 可在此处查找文本到语音区域设置列表。
使用 URI 发出 HTTP PUT 请求,如以下 Consents_Create 示例所示。
- 将
YourResourceKey
替换为语音资源密钥。 - 将
YourResourceRegion
替换为语音资源区域。 - 将
JessicaConsentId
替换为所选的同意 ID。 同意的 URI 中将使用区分大小写的 ID 并且此内容以后无法更改。
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
"locale": "en-US"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
你应该会收到以下格式的响应正文:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
响应头包含 Operation-Location
属性。 使用此 URI 获取有关 Consents_Create 操作的详细信息。 以下是响应头示例:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314