Delen via


Stemtalenttoestemming toevoegen aan het professionele spraakproject

Een stemtalent is een individuele of doelluidspreker waarvan stemmen worden opgenomen en gebruikt om neurale spraakmodellen te maken.

Voordat u een neurale stem kunt trainen, moet u een opname indienen van de toestemmingsverklaring van het stemtalent. De voice talent statement is een opname van het stemtalent dat een verklaring leest dat ze toestemming geven voor het gebruik van hun spraakgegevens om een aangepast spraakmodel te trainen. De toestemmingsverklaring wordt ook gebruikt om te controleren of het stemtalent dezelfde persoon is als de spreker in de trainingsgegevens.

Tip

Voordat u aan de slag gaat in Speech Studio, definieert u uw stempersoon en kiest u het juiste stemtalent.

U vindt de mondelinge toestemmingsverklaring in meerdere talen op GitHub. De taal van de mondelinge instructie moet hetzelfde zijn als uw opname. Zie ook de openbaarmaking voor spraaktalent.

Spraaktalent toevoegen

Volg deze stappen om een spraaktalentprofiel toe te voegen en hun toestemmingsverklaring te uploaden:

  1. Meld u aan bij Speech Studio.
  2. Selecteer Custom voice> Your project name >Set up voice talent>Add voice talent.
  3. Beschrijf in de wizard Nieuwe spraaktalent toevoegen de kenmerken van de stem die u gaat maken. De scenario's die u hier opgeeft, moeten consistent zijn met wat u hebt opgegeven in het toepassingsformulier.
  4. Selecteer Volgende.
  5. Volg op de pagina Stemtalentinstructie uploaden de instructies voor het uploaden van de stemtalentinstructie die u vooraf hebt opgenomen. Zorg ervoor dat de mondelinge instructie is vastgelegd met dezelfde instellingen, omgeving en spreekstijl als uw trainingsgegevens. Schermopname van het dialoogvenster voor het uploaden van spraaktalentinstructie.
  6. Voer de naam van het stemtalent en de bedrijfsnaam in. De naam van het stemtalent moet de naam zijn van de persoon die de toestemmingsverklaring heeft opgenomen. Voer de naam in dezelfde taal in die in de vastgelegde instructie wordt gebruikt. De bedrijfsnaam moet overeenkomen met de bedrijfsnaam die in de opgenomen instructie is gesproken. Zorg ervoor dat de bedrijfsnaam is ingevoerd in dezelfde taal als de vastgelegde instructie.
  7. Selecteer Volgende.
  8. Controleer de details van spraaktalent en persona en selecteer Verzenden.

Nadat de status van stemtalent is geslaagd, kunt u doorgaan met het trainen van uw aangepaste spraakmodel.

Volgende stappen

Met de professionele spraakfunctie is vereist dat elke stem wordt gemaakt met expliciete toestemming van de gebruiker. Een opgenomen instructie van de gebruiker is vereist om te bevestigen dat de klant (Azure AI Speech-resource-eigenaar) hun stem zal maken en gebruiken.

Als u toestemming voor spraaktalent wilt toevoegen aan het professionele spraakproject, krijgt u het vooraf opgenomen toestemmingsaudiobestand van een openbaar toegankelijke URL (Consents_Create) of uploadt u het audiobestand (Consents_Post). In dit artikel voegt u toestemming toe vanuit een URL.

U hebt een audio-opname van de gebruiker nodig die de toestemmingsverklaring spreekt.

U kunt de tekst van de toestemmingsverklaring voor elke landinstelling ophalen uit de tekst naar de GitHub-opslagplaats voor spraak. Zie SpeakerAuthorization.txt voor de toestemmingsverklaring voor de en-US landinstelling:

"I  [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

Als u toestemming wilt geven voor een professioneel spraakproject vanuit de URL van een audiobestand, gebruikt u de Consents_Create bewerking van de aangepaste spraak-API. Bouw de aanvraagbody volgens de volgende instructies:

  • Stel de vereiste projectId eigenschap in. Zie Een project maken.
  • Stel de vereiste voiceTalentName eigenschap in. De naam van het stemtalent moet de naam zijn van de persoon die de toestemmingsverklaring heeft opgenomen. Voer de naam in dezelfde taal in die in de vastgelegde instructie wordt gebruikt. De naam van het stemtalent kan later niet meer worden gewijzigd.
  • Stel de vereiste companyName eigenschap in. De bedrijfsnaam moet overeenkomen met de bedrijfsnaam die in de opgenomen instructie wordt gesproken. Zorg ervoor dat de bedrijfsnaam is ingevoerd in dezelfde taal als de vastgelegde instructie. De bedrijfsnaam kan later niet meer worden gewijzigd.
  • Stel de vereiste audioUrl eigenschap in. De URL van het audiobestand stemtalenttoestemming. Gebruik een URI met het SAS-token (Shared Access Signatures).
  • Stel de vereiste locale eigenschap in. Dit moet de landinstelling van de toestemming zijn. De landinstelling kan later niet meer worden gewijzigd. Hier vindt u de lijst met taalinstellingen voor tekst.

Maak een HTTP PUT-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende Consents_Create voorbeeld.

  • Vervang door YourResourceKey uw Spraak-resourcesleutel.
  • Vervang door YourResourceRegion uw spraakresourceregio.
  • Vervang door JessicaConsentId een toestemmings-id van uw keuze. De hoofdlettergevoelige id wordt gebruikt in de URI van de toestemming en kan later niet meer worden gewijzigd.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

U ontvangt een antwoordtekst in de volgende indeling:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

De antwoordheader bevat de Operation-Location eigenschap. Gebruik deze URI voor meer informatie over de Consents_Create-bewerking . Hier volgt een voorbeeld van de antwoordheader:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

Volgende stappen