Stemtalenttoestemming toevoegen aan het professionele spraakproject
Een stemtalent is een individuele of doelluidspreker waarvan stemmen worden opgenomen en gebruikt om neurale spraakmodellen te maken.
Voordat u een neurale stem kunt trainen, moet u een opname indienen van de toestemmingsverklaring van het stemtalent. De voice talent statement is een opname van het stemtalent dat een verklaring leest dat ze toestemming geven voor het gebruik van hun spraakgegevens om een aangepast spraakmodel te trainen. De toestemmingsverklaring wordt ook gebruikt om te controleren of het stemtalent dezelfde persoon is als de spreker in de trainingsgegevens.
Tip
Voordat u aan de slag gaat in Speech Studio, definieert u uw stempersoon en kiest u het juiste stemtalent.
U vindt de mondelinge toestemmingsverklaring in meerdere talen op GitHub. De taal van de mondelinge instructie moet hetzelfde zijn als uw opname. Zie ook de openbaarmaking voor spraaktalent.
Spraaktalent toevoegen
Volg deze stappen om een spraaktalentprofiel toe te voegen en hun toestemmingsverklaring te uploaden:
- Meld u aan bij Speech Studio.
- Selecteer Custom voice> Your project name >Set up voice talent>Add voice talent.
- Beschrijf in de wizard Nieuwe spraaktalent toevoegen de kenmerken van de stem die u gaat maken. De scenario's die u hier opgeeft, moeten consistent zijn met wat u hebt opgegeven in het toepassingsformulier.
- Selecteer Volgende.
- Volg op de pagina Stemtalentinstructie uploaden de instructies voor het uploaden van de stemtalentinstructie die u vooraf hebt opgenomen. Zorg ervoor dat de mondelinge instructie is vastgelegd met dezelfde instellingen, omgeving en spreekstijl als uw trainingsgegevens.
- Voer de naam van het stemtalent en de bedrijfsnaam in. De naam van het stemtalent moet de naam zijn van de persoon die de toestemmingsverklaring heeft opgenomen. Voer de naam in dezelfde taal in die in de vastgelegde instructie wordt gebruikt. De bedrijfsnaam moet overeenkomen met de bedrijfsnaam die in de opgenomen instructie is gesproken. Zorg ervoor dat de bedrijfsnaam is ingevoerd in dezelfde taal als de vastgelegde instructie.
- Selecteer Volgende.
- Controleer de details van spraaktalent en persona en selecteer Verzenden.
Nadat de status van stemtalent is geslaagd, kunt u doorgaan met het trainen van uw aangepaste spraakmodel.
Volgende stappen
Met de professionele spraakfunctie is vereist dat elke stem wordt gemaakt met expliciete toestemming van de gebruiker. Een opgenomen instructie van de gebruiker is vereist om te bevestigen dat de klant (Azure AI Speech-resource-eigenaar) hun stem zal maken en gebruiken.
Als u toestemming voor spraaktalent wilt toevoegen aan het professionele spraakproject, krijgt u het vooraf opgenomen toestemmingsaudiobestand van een openbaar toegankelijke URL (Consents_Create) of uploadt u het audiobestand (Consents_Post). In dit artikel voegt u toestemming toe vanuit een URL.
Toestemmingsverklaring
U hebt een audio-opname van de gebruiker nodig die de toestemmingsverklaring spreekt.
U kunt de tekst van de toestemmingsverklaring voor elke landinstelling ophalen uit de tekst naar de GitHub-opslagplaats voor spraak. Zie SpeakerAuthorization.txt voor de toestemmingsverklaring voor de en-US
landinstelling:
"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
Toestemming toevoegen vanuit een URL
Als u toestemming wilt geven voor een professioneel spraakproject vanuit de URL van een audiobestand, gebruikt u de Consents_Create bewerking van de aangepaste spraak-API. Bouw de aanvraagbody volgens de volgende instructies:
- Stel de vereiste
projectId
eigenschap in. Zie Een project maken. - Stel de vereiste
voiceTalentName
eigenschap in. De naam van het stemtalent moet de naam zijn van de persoon die de toestemmingsverklaring heeft opgenomen. Voer de naam in dezelfde taal in die in de vastgelegde instructie wordt gebruikt. De naam van het stemtalent kan later niet meer worden gewijzigd. - Stel de vereiste
companyName
eigenschap in. De bedrijfsnaam moet overeenkomen met de bedrijfsnaam die in de opgenomen instructie wordt gesproken. Zorg ervoor dat de bedrijfsnaam is ingevoerd in dezelfde taal als de vastgelegde instructie. De bedrijfsnaam kan later niet meer worden gewijzigd. - Stel de vereiste
audioUrl
eigenschap in. De URL van het audiobestand stemtalenttoestemming. Gebruik een URI met het SAS-token (Shared Access Signatures). - Stel de vereiste
locale
eigenschap in. Dit moet de landinstelling van de toestemming zijn. De landinstelling kan later niet meer worden gewijzigd. Hier vindt u de lijst met taalinstellingen voor tekst.
Maak een HTTP PUT-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende Consents_Create voorbeeld.
- Vervang door
YourResourceKey
uw Spraak-resourcesleutel. - Vervang door
YourResourceRegion
uw spraakresourceregio. - Vervang door
JessicaConsentId
een toestemmings-id van uw keuze. De hoofdlettergevoelige id wordt gebruikt in de URI van de toestemming en kan later niet meer worden gewijzigd.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
"locale": "en-US"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
U ontvangt een antwoordtekst in de volgende indeling:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
De antwoordheader bevat de Operation-Location
eigenschap. Gebruik deze URI voor meer informatie over de Consents_Create-bewerking . Hier volgt een voorbeeld van de antwoordheader:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314