Een sprekerprofiel-id voor de persoonlijke stem ophalen
Als u persoonlijke spraak in uw toepassing wilt gebruiken, moet u een profiel-id voor de spreker ophalen. De sprekerprofiel-id wordt gebruikt om gesynthetiseerde audio te genereren met de opgegeven tekstinvoer.
U maakt een sprekerprofiel-id op basis van de mondelinge toestemmingsverklaring van de spreker en een audioprompt (een schoon menselijk spraakvoorbeeld tussen 5 en 90 seconden). De spraakkenmerken van de gebruiker worden gecodeerd in de speakerProfileId
eigenschap die wordt gebruikt voor tekst-naar-spraak. Zie Persoonlijke stem gebruiken in uw toepassing voor meer informatie.
Notitie
De persoonlijke spraak-id en sprekerprofiel-id zijn niet hetzelfde. U kunt de persoonlijke spraak-id kiezen, maar de sprekerprofiel-id wordt gegenereerd door de service. De persoonlijke spraak-id wordt gebruikt om de persoonlijke stem te beheren. De sprekerprofiel-id wordt gebruikt voor tekst naar spraak.
U geeft de audiobestanden op via een openbaar toegankelijke URL (PersonalVoices_Create) of upload de audiobestanden (PersonalVoices_Post).
Audio-indeling vragen
De ondersteunde indelingen voor prompt-audiobestanden zijn:
Notatie | Samplefrequentie | Bitrate | Bitdiepte |
---|---|---|---|
mp3 | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | 128 kbps, 192 kbps, 256kbbits, 320kbbits | / |
wav | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | / | 16-bits, 24-bits, 32-bits |
Persoonlijke stem maken op basis van een bestand
In dit scenario moeten de audiobestanden lokaal beschikbaar zijn.
Als u een persoonlijke stem wilt maken en de id van het sprekerprofiel wilt ophalen, gebruikt u de PersonalVoices_Post bewerking van de aangepaste spraak-API. Bouw de aanvraagbody volgens de volgende instructies:
- Stel de vereiste
projectId
eigenschap in. Zie Een project maken. - Stel de vereiste
consentId
eigenschap in. Zie Gebruikerstoestemming toevoegen. - Stel de vereiste
audiodata
eigenschap in. U kunt een of meer audiobestanden in dezelfde aanvraag opgeven.
Maak een HTTP POST-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende PersonalVoices_Post voorbeeld.
- Vervang door
YourResourceKey
uw Spraak-resourcesleutel. - Vervang door
YourResourceRegion
uw spraakresourceregio. - Vervang door
JessicaPersonalVoiceId
een persoonlijke stem-id van uw keuze. De hoofdlettergevoelige id wordt gebruikt in de URI van de persoonlijke stem en kan later niet meer worden gewijzigd.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"
U ontvangt een antwoordtekst in de volgende indeling:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
Gebruik de speakerProfileId
eigenschap om persoonlijke spraak in uw tekst te integreren in spraaktoepassing. Zie Persoonlijke stem gebruiken in uw toepassing voor meer informatie.
De antwoordheader bevat de Operation-Location
eigenschap. Gebruik deze URI voor meer informatie over de PersonalVoices_Post-bewerking . Hier volgt een voorbeeld van de antwoordheader:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f
Persoonlijke stem maken op basis van een URL
In dit scenario moeten de audiobestanden al worden opgeslagen in een Azure Blob Storage-container.
Als u een persoonlijke stem wilt maken en de id van het sprekerprofiel wilt ophalen, gebruikt u de PersonalVoices_Create bewerking van de aangepaste spraak-API. Bouw de aanvraagbody volgens de volgende instructies:
- Stel de vereiste
projectId
eigenschap in. Zie Een project maken. - Stel de vereiste
consentId
eigenschap in. Zie Gebruikerstoestemming toevoegen. - Stel de vereiste
audios
eigenschap in. Stel in deaudios
eigenschap de volgende eigenschappen in:- Stel de vereiste
containerUrl
eigenschap in op de URL van de Azure Blob Storage-container die de audiobestanden bevat. Sas (Shared Access Signatures) gebruiken voor een container met lees- en lijstmachtigingen. - Stel de vereiste eigenschap in
extensions
op de extensies van de audiobestanden. - Stel desgewenst de
prefix
eigenschap in om een voorvoegsel in te stellen voor de blobnaam.
- Stel de vereiste
Maak een HTTP PUT-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende PersonalVoices_Create voorbeeld.
- Vervang door
YourResourceKey
uw Spraak-resourcesleutel. - Vervang door
YourResourceRegion
uw spraakresourceregio. - Vervang door
JessicaPersonalVoiceId
een persoonlijke stem-id van uw keuze. De hoofdlettergevoelige id wordt gebruikt in de URI van de persoonlijke stem en kan later niet meer worden gewijzigd.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"audios": {
"containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
"prefix": "jessica/",
"extensions": [
".wav"
]
}
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"
# Ensure the `containerUrl` has both read and list permissions.
# Ensure the `.wav` files are located in the "jessica" folder within the container. The `prefix` matches all `.wav` files in the "jessica" folder. If there is no such folder, the prefix will match `.wav` files with names starting with "jessica".
U ontvangt een antwoordtekst in de volgende indeling:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
Gebruik de speakerProfileId
eigenschap om persoonlijke spraak in uw tekst te integreren in spraaktoepassing. Zie Persoonlijke stem gebruiken in uw toepassing voor meer informatie.
De antwoordheader bevat de Operation-Location
eigenschap. Gebruik deze URI voor meer informatie over de PersonalVoices_Create bewerking. Hier volgt een voorbeeld van de antwoordheader:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f