Delen via


Een sprekerprofiel-id voor de persoonlijke stem ophalen

Als u persoonlijke spraak in uw toepassing wilt gebruiken, moet u een profiel-id voor de spreker ophalen. De sprekerprofiel-id wordt gebruikt om gesynthetiseerde audio te genereren met de opgegeven tekstinvoer.

U maakt een sprekerprofiel-id op basis van de mondelinge toestemmingsverklaring van de spreker en een audioprompt (een schoon menselijk spraakvoorbeeld tussen 5 en 90 seconden). De spraakkenmerken van de gebruiker worden gecodeerd in de speakerProfileId eigenschap die wordt gebruikt voor tekst-naar-spraak. Zie Persoonlijke stem gebruiken in uw toepassing voor meer informatie.

Notitie

De persoonlijke spraak-id en sprekerprofiel-id zijn niet hetzelfde. U kunt de persoonlijke spraak-id kiezen, maar de sprekerprofiel-id wordt gegenereerd door de service. De persoonlijke spraak-id wordt gebruikt om de persoonlijke stem te beheren. De sprekerprofiel-id wordt gebruikt voor tekst naar spraak.

U geeft de audiobestanden op via een openbaar toegankelijke URL (PersonalVoices_Create) of upload de audiobestanden (PersonalVoices_Post).

Audio-indeling vragen

De ondersteunde indelingen voor prompt-audiobestanden zijn:

Notatie Samplefrequentie Bitrate Bitdiepte
mp3 16 kHz, 24 kHz, 44,1 kHz, 48 kHz 128 kbps, 192 kbps, 256kbbits, 320kbbits /
wav 16 kHz, 24 kHz, 44,1 kHz, 48 kHz / 16-bits, 24-bits, 32-bits

Persoonlijke stem maken op basis van een bestand

In dit scenario moeten de audiobestanden lokaal beschikbaar zijn.

Als u een persoonlijke stem wilt maken en de id van het sprekerprofiel wilt ophalen, gebruikt u de PersonalVoices_Post bewerking van de aangepaste spraak-API. Bouw de aanvraagbody volgens de volgende instructies:

  • Stel de vereiste projectId eigenschap in. Zie Een project maken.
  • Stel de vereiste consentId eigenschap in. Zie Gebruikerstoestemming toevoegen.
  • Stel de vereiste audiodata eigenschap in. U kunt een of meer audiobestanden in dezelfde aanvraag opgeven.

Maak een HTTP POST-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende PersonalVoices_Post voorbeeld.

  • Vervang door YourResourceKey uw Spraak-resourcesleutel.
  • Vervang door YourResourceRegion uw spraakresourceregio.
  • Vervang door JessicaPersonalVoiceId een persoonlijke stem-id van uw keuze. De hoofdlettergevoelige id wordt gebruikt in de URI van de persoonlijke stem en kan later niet meer worden gewijzigd.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"

U ontvangt een antwoordtekst in de volgende indeling:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Gebruik de speakerProfileId eigenschap om persoonlijke spraak in uw tekst te integreren in spraaktoepassing. Zie Persoonlijke stem gebruiken in uw toepassing voor meer informatie.

De antwoordheader bevat de Operation-Location eigenschap. Gebruik deze URI voor meer informatie over de PersonalVoices_Post-bewerking . Hier volgt een voorbeeld van de antwoordheader:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

Persoonlijke stem maken op basis van een URL

In dit scenario moeten de audiobestanden al worden opgeslagen in een Azure Blob Storage-container.

Als u een persoonlijke stem wilt maken en de id van het sprekerprofiel wilt ophalen, gebruikt u de PersonalVoices_Create bewerking van de aangepaste spraak-API. Bouw de aanvraagbody volgens de volgende instructies:

  • Stel de vereiste projectId eigenschap in. Zie Een project maken.
  • Stel de vereiste consentId eigenschap in. Zie Gebruikerstoestemming toevoegen.
  • Stel de vereiste audios eigenschap in. Stel in de audios eigenschap de volgende eigenschappen in:
    • Stel de vereiste containerUrl eigenschap in op de URL van de Azure Blob Storage-container die de audiobestanden bevat. Sas (Shared Access Signatures) gebruiken voor een container met lees- en lijstmachtigingen.
    • Stel de vereiste eigenschap in extensions op de extensies van de audiobestanden.
    • Stel desgewenst de prefix eigenschap in om een voorvoegsel in te stellen voor de blobnaam.

Maak een HTTP PUT-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende PersonalVoices_Create voorbeeld.

  • Vervang door YourResourceKey uw Spraak-resourcesleutel.
  • Vervang door YourResourceRegion uw spraakresourceregio.
  • Vervang door JessicaPersonalVoiceId een persoonlijke stem-id van uw keuze. De hoofdlettergevoelige id wordt gebruikt in de URI van de persoonlijke stem en kan later niet meer worden gewijzigd.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "audios": {
    "containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
    "prefix": "jessica/", 
    "extensions": [
      ".wav"
    ]
  }
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"

# Ensure the `containerUrl` has both read and list permissions. 
# Ensure the `.wav` files are located in the "jessica" folder within the container. The `prefix` matches all `.wav` files in the "jessica" folder. If there is no such folder, the prefix will match `.wav` files with names starting with "jessica". 

U ontvangt een antwoordtekst in de volgende indeling:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Gebruik de speakerProfileId eigenschap om persoonlijke spraak in uw tekst te integreren in spraaktoepassing. Zie Persoonlijke stem gebruiken in uw toepassing voor meer informatie.

De antwoordheader bevat de Operation-Location eigenschap. Gebruik deze URI voor meer informatie over de PersonalVoices_Create bewerking. Hier volgt een voorbeeld van de antwoordheader:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

Volgende stappen