Tworzenie projektu dla profesjonalnego głosu
Zawartość niestandardowego neuronowego głosu , takiego jak dane, modele, testy i punkty końcowe, są zorganizowane w projekty w usłudze Speech Studio. Każdy projekt jest specyficzny dla kraju/regionu i języka oraz płci głosu, który chcesz utworzyć. Możesz na przykład utworzyć projekt dla kobiecego głosu dla czatbotów centrum telefonicznego, które używają języka angielskiego w Stany Zjednoczone.
Napiwek
Wypróbuj niestandardowy neuronowy głos (CNV) Lite , aby przeprowadzić pokaz i ocenić CNV przed zainwestowaniem w profesjonalne nagrania, aby stworzyć głos o wyższej jakości.
Wszystko, co trzeba rozpocząć, to kilka plików audio i skojarzonych transkrypcji. Sprawdź, czy niestandardowy neuronowy głos obsługuje Twój język i region.
Tworzenie niestandardowego projektu neuronowego głosu Pro
Aby utworzyć niestandardowy projekt neuronowego głosu Pro, wykonaj następujące kroki:
Zaloguj się do programu Speech Studio.
Wybierz subskrypcję i zasób usługi Mowa do pracy.
Ważne
Niestandardowe trenowanie neuronowego głosu jest obecnie dostępne tylko w niektórych regionach. Po wytrenowanym modelu głosowym w obsługiwanym regionie możesz skopiować go do zasobu usługi Mowa w innym regionie zgodnie z potrzebami. Aby uzyskać więcej informacji, zobacz przypisy dolne w tabeli regionów .
Wybierz pozycję Niestandardowy głos>Utwórz projekt.
Wybierz pozycję Niestandardowy neuronowy głos Pro>Dalej.
Postępuj zgodnie z instrukcjami podanymi przez kreatora, aby utworzyć projekt.
Wybierz nowy projekt według nazwy lub wybierz pozycję Przejdź do projektu. Te elementy menu zostaną wyświetlone na panelu po lewej stronie: Konfigurowanie talentów głosowych, Przygotowywanie danych treningowych, Trenowanie modelu i Wdrażanie modelu.
Następne kroki
Profesjonalne projekty głosowe zawierają instrukcję wyrażania zgody na talent głos, zestawy danych szkoleniowych, modele głosowe i punkty końcowe.
Każdy projekt jest specyficzny dla kraju/regionu i języka oraz płci głosu, który chcesz utworzyć. Możesz na przykład utworzyć projekt dla kobiecego głosu dla czatbotów centrum telefonicznego, które używają języka angielskiego w Stany Zjednoczone.
Tworzenie projektu
Aby utworzyć profesjonalny projekt głosowy, użyj Projects_Create operacji niestandardowego interfejsu API głosu. Skonstruuj treść żądania zgodnie z następującymi instrukcjami:
- Ustaw wymaganą
kind
właściwość naProfessionalVoice
. Nie można później zmienić rodzaju. - Opcjonalnie ustaw
description
właściwość opisu projektu. Opis projektu można zmienić później.
Utwórz żądanie HTTP PUT przy użyciu identyfikatora URI, jak pokazano w poniższym przykładzie Projects_Create .
- Zastąp
YourResourceKey
ciąg kluczem zasobu usługi Mowa. - Zastąp
YourResourceRegion
element regionem zasobu usługi Mowa. - Zastąp
ProjectId
element wybranym identyfikatorem projektu. Identyfikator uwzględniający wielkość liter musi być unikatowy w ramach zasobu usługi Mowa. Identyfikator będzie używany w identyfikatorze URI projektu i nie można go później zmienić.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Project description",
"kind": "ProfessionalVoice"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2024-02-01-preview"
Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:
{
"id": "ProjectId",
"description": "Project description",
"kind": "ProfessionalVoice",
"createdDateTime": "2023-04-01T05:30:00.000Z"
}
Projekt jest używany w kolejnych żądaniach interfejsu id
API, aby dodać zgodę na talent głosowy i utworzyć zestaw szkoleniowy.