Een sprekerprofiel-id voor de persoonlijke stem ophalen

Artikel
03/10/2025

Als u persoonlijke spraak in uw toepassing wilt gebruiken, moet u een profiel-id voor de spreker ophalen. De sprekerprofiel-id wordt gebruikt om gesynthetiseerde audio te genereren met de opgegeven tekstinvoer.

U maakt een sprekerprofiel-id op basis van de mondelinge toestemmingsverklaring van de spreker en een audioprompt (een schoon menselijk spraakvoorbeeld tussen 5 en 90 seconden). De spraakkenmerken van de gebruiker worden gecodeerd in de speakerProfileId eigenschap die wordt gebruikt voor tekst-naar-spraak. Zie Persoonlijke stem gebruiken in uw toepassing voor meer informatie.

Notitie

De persoonlijke spraak-id en sprekerprofiel-id zijn niet hetzelfde. U kunt de persoonlijke spraak-id kiezen, maar de sprekerprofiel-id wordt gegenereerd door de service. De persoonlijke spraak-id wordt gebruikt om de persoonlijke stem te beheren. De sprekerprofiel-id wordt gebruikt voor tekst naar spraak.

U geeft de audiobestanden op via een openbaar toegankelijke URL (PersonalVoices_Create) of upload de audiobestanden (PersonalVoices_Post).

Audio-indeling vragen

De ondersteunde indelingen voor prompt-audiobestanden zijn:

Notatie	Samplefrequentie	Bitrate	Bitdiepte
mp3	16 kHz, 24 kHz, 44,1 kHz, 48 kHz	128 kbps, 192 kbps, 256kbbits, 320kbbits	/
wav	16 kHz, 24 kHz, 44,1 kHz, 48 kHz	/	16-bits, 24-bits, 32-bits

Persoonlijke stem maken op basis van een bestand

In dit scenario moeten de audiobestanden lokaal beschikbaar zijn.

Als u een persoonlijke stem wilt maken en de id van het sprekerprofiel wilt ophalen, gebruikt u de PersonalVoices_Post bewerking van de aangepaste spraak-API. Bouw de aanvraagbody volgens de volgende instructies:

Stel de vereiste projectId eigenschap in. Zie Een project maken.
Stel de vereiste consentId eigenschap in. Zie Gebruikerstoestemming toevoegen.
Stel de vereiste audiodata eigenschap in. U kunt een of meer audiobestanden in dezelfde aanvraag opgeven.

Maak een HTTP POST-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende PersonalVoices_Post voorbeeld.

Vervang door YourResourceKey uw Spraak-resourcesleutel.
Vervang door YourResourceRegion uw spraakresourceregio.
Vervang door JessicaPersonalVoiceId een persoonlijke stem-id van uw keuze. De hoofdlettergevoelige id wordt gebruikt in de URI van de persoonlijke stem en kan later niet meer worden gewijzigd.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"

U ontvangt een antwoordtekst in de volgende indeling:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Gebruik de speakerProfileId eigenschap om persoonlijke spraak in uw tekst te integreren in spraaktoepassing. Zie Persoonlijke stem gebruiken in uw toepassing voor meer informatie.

De antwoordheader bevat de Operation-Location eigenschap. Gebruik deze URI voor meer informatie over de PersonalVoices_Post-bewerking . Hier volgt een voorbeeld van de antwoordheader:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

Persoonlijke stem maken op basis van een URL

In dit scenario moeten de audiobestanden al worden opgeslagen in een Azure Blob Storage-container.

Als u een persoonlijke stem wilt maken en de id van het sprekerprofiel wilt ophalen, gebruikt u de PersonalVoices_Create bewerking van de aangepaste spraak-API. Bouw de aanvraagbody volgens de volgende instructies:

Stel de vereiste projectId eigenschap in. Zie Een project maken.
Stel de vereiste consentId eigenschap in. Zie Gebruikerstoestemming toevoegen.
Stel de vereiste audios eigenschap in. Stel in de audios eigenschap de volgende eigenschappen in:
- Stel de vereiste containerUrl eigenschap in op de URL van de Azure Blob Storage-container die de audiobestanden bevat. Sas (Shared Access Signatures) gebruiken voor een container met lees- en lijstmachtigingen.
- Stel de vereiste eigenschap in extensions op de extensies van de audiobestanden.
- Stel desgewenst de prefix eigenschap in om een voorvoegsel in te stellen voor de blobnaam.

Maak een HTTP PUT-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende PersonalVoices_Create voorbeeld.

Vervang door YourResourceKey uw Spraak-resourcesleutel.
Vervang door YourResourceRegion uw spraakresourceregio.
Vervang door JessicaPersonalVoiceId een persoonlijke stem-id van uw keuze. De hoofdlettergevoelige id wordt gebruikt in de URI van de persoonlijke stem en kan later niet meer worden gewijzigd.

curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "audios": {
    "containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
    "prefix": "jessica/", 
    "extensions": [
      ".wav"
    ]
  }
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"

# Ensure the `containerUrl` has both read and list permissions. 
# Ensure the `.wav` files are located in the "jessica" folder within the container. The `prefix` matches all `.wav` files in the "jessica" folder. If there is no such folder, the prefix will match `.wav` files with names starting with "jessica".

U ontvangt een antwoordtekst in de volgende indeling:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Gebruik de speakerProfileId eigenschap om persoonlijke spraak in uw tekst te integreren in spraaktoepassing. Zie Persoonlijke stem gebruiken in uw toepassing voor meer informatie.

De antwoordheader bevat de Operation-Location eigenschap. Gebruik deze URI voor meer informatie over de PersonalVoices_Create bewerking. Hier volgt een voorbeeld van de antwoordheader:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

Volgende stappen

Gebruik persoonlijke stem in uw toepassing..

Delen via

Een sprekerprofiel-id voor de persoonlijke stem ophalen

Audio-indeling vragen

Persoonlijke stem maken op basis van een bestand

Persoonlijke stem maken op basis van een URL

Volgende stappen

Feedback

Aanvullende resources