Získání ID profilu mluvčího pro osobní hlas
Pokud chcete ve své aplikaci používat osobní hlas, musíte získat ID profilu mluvčího. ID profilu mluvčího se používá k vygenerování syntetizovaného zvuku s poskytnutým textovým vstupem.
Id profilu mluvčího vytvoříte na základě ústního prohlášení o souhlasu mluvčího a zvukové výzvy (čistý vzorek lidského hlasu v rozmezí 5 až 90 sekund). Vlastnosti hlasu uživatele jsou kódovány ve speakerProfileId
vlastnosti, která se používá pro převod textu na řeč. Další informace najdete v tématu Použití osobního hlasu v aplikaci.
Poznámka:
ID osobního hlasu a ID profilu mluvčího nejsou stejné. Můžete zvolit osobní ID hlasu, ale služba vygeneruje ID profilu mluvčího. Osobní ID hlasu slouží ke správě osobního hlasu. ID profilu mluvčího se používá pro převod textu na řeč.
Zvukové soubory zadáte z veřejně přístupné adresy URL (PersonalVoices_Create) nebo nahrajete zvukové soubory (PersonalVoices_Post).
Formát vyzvání zvuku
Podporované formáty zvukových souborů výzvy jsou:
Formát | Vzorkovací frekvence | Přenosová rychlost | Hloubka bitu |
---|---|---|---|
mp3 | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | 128 kb/s, 192 kb/s, 256 kb/s, 320 kB/s | / |
wav | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | / | 16bitová, 24bitová, 32bitová |
Vytvoření osobního hlasu ze souboru
V tomto scénáři musí být zvukové soubory dostupné místně.
Pokud chcete vytvořit osobní hlas a získat ID profilu mluvčího, použijte PersonalVoices_Post operaci vlastního hlasového rozhraní API. Sestavte tělo požadavku podle následujících pokynů:
- Nastavte požadovanou
projectId
vlastnost. Viz vytvoření projektu. - Nastavte požadovanou
consentId
vlastnost. Viz přidání souhlasu uživatele. - Nastavte požadovanou
audiodata
vlastnost. Ve stejném požadavku můžete zadat jeden nebo více zvukových souborů.
Vytvořte požadavek HTTP POST pomocí identifikátoru URI, jak je znázorněno v následujícím příkladu PersonalVoices_Post.
- Nahraďte
YourResourceKey
klíčem prostředku služby Speech. - Nahraďte
YourResourceRegion
oblastí prostředků služby Speech. - Nahraďte
JessicaPersonalVoiceId
osobním hlasovým ID podle vašeho výběru. V identifikátoru URI osobního hlasu se použije id s rozlišováním velkých a malých a malých písmen a nebude možné ho později změnit.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"
Měl by se zobrazit text odpovědi v následujícím formátu:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
speakerProfileId
Pomocí vlastnosti můžete integrovat osobní hlas do aplikace pro řeč. Další informace najdete v tématu Použití osobního hlasu v aplikaci.
Hlavička odpovědi obsahuje Operation-Location
vlastnost. Pomocí tohoto identifikátoru URI získáte podrobnosti o operaci PersonalVoices_Post . Tady je příklad hlavičky odpovědi:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f
Vytvoření osobního hlasu z adresy URL
V tomto scénáři už musí být zvukové soubory uložené v kontejneru Azure Blob Storage.
Pokud chcete vytvořit osobní hlas a získat ID profilu mluvčího, použijte PersonalVoices_Create operaci vlastního hlasového rozhraní API. Sestavte tělo požadavku podle následujících pokynů:
- Nastavte požadovanou
projectId
vlastnost. Viz vytvoření projektu. - Nastavte požadovanou
consentId
vlastnost. Viz přidání souhlasu uživatele. - Nastavte požadovanou
audios
vlastnost. V rámciaudios
vlastnosti nastavte následující vlastnosti:- Nastavte požadovanou
containerUrl
vlastnost na adresu URL kontejneru Azure Blob Storage, který obsahuje zvukové soubory. Pro kontejner použijte sdílený přístupový podpis (SAS) s oprávněními ke čtení i seznamu. - Nastavte požadovanou
extensions
vlastnost na rozšíření zvukových souborů. - Volitelně můžete nastavit vlastnost tak,
prefix
aby nastavil předponu názvu objektu blob.
- Nastavte požadovanou
Vytvořte požadavek HTTP PUT pomocí identifikátoru URI, jak je znázorněno v následujícím příkladu PersonalVoices_Create.
- Nahraďte
YourResourceKey
klíčem prostředku služby Speech. - Nahraďte
YourResourceRegion
oblastí prostředků služby Speech. - Nahraďte
JessicaPersonalVoiceId
osobním hlasovým ID podle vašeho výběru. V identifikátoru URI osobního hlasu se použije id s rozlišováním velkých a malých a malých písmen a nebude možné ho později změnit.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"audios": {
"containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
"prefix": "jessica/",
"extensions": [
".wav"
]
}
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"
# Ensure the `containerUrl` has both read and list permissions.
# Ensure the `.wav` files are located in the "jessica" folder within the container. The `prefix` matches all `.wav` files in the "jessica" folder. If there is no such folder, the prefix will match `.wav` files with names starting with "jessica".
Měl by se zobrazit text odpovědi v následujícím formátu:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
speakerProfileId
Pomocí vlastnosti můžete integrovat osobní hlas do aplikace pro řeč. Další informace najdete v tématu Použití osobního hlasu v aplikaci.
Hlavička odpovědi obsahuje Operation-Location
vlastnost. Pomocí tohoto identifikátoru URI získáte podrobnosti o operaci PersonalVoices_Create . Tady je příklad hlavičky odpovědi:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f