Dokumentacja interfejsu API niestandardowego głosu — Azure Cognitive Services

Artykuł
05/01/2024

W tym artykule pokazano, jak wywołać punkt końcowy interfejsu API REST dla usługi Custom Voice , usługi w pakiecie azure Cognitive Services. Niestandardowy głos to funkcja zamiany tekstu na mowę, która umożliwia tworzenie jedną z typów, dostosowanych, syntetycznych głosów dla aplikacji. Dzięki niestandardowemu głosowi możesz utworzyć bardzo naturalny głos dla marki lub znaków, dostarczając próbki mowy ludzkiej jako dane szkoleniowe. Istnieją dwa scenariusze dla niestandardowego głosu: profesjonalny i osobisty. Aby zrozumieć każdy scenariusz i wymagania dotyczące danych, przeczytaj dokumenty dotyczące profesjonalnego i osobistego głosu.

Żądanie dostępu

Zarówno profesjonalny głos, jak i osobisty dostęp do głosu są ograniczone na podstawie kryteriów uprawnień i użycia. Zażądaj dostępu przed użyciem interfejsu API REST.

Tworzenie profesjonalnego głosu

Wywołaj interfejs API REST, wykonując następujące kroki.

Twórca projekt profesjonalnego głosu.
Dodaj zgodę na talent głosowy.
Dodaj profesjonalny zestaw danych do trenowania głosu.
Trenowanie profesjonalnego modelu głosu.
Wdróż profesjonalny model głosu jako punkt końcowy.
Synteza za pomocą zestawu SDK mowy. (Nie jest to część tego interfejsu API. Przeczytaj dokument).

Tworzenie osobistego głosu

Wywołaj interfejs API REST, wykonując następujące kroki.

Twórca projekt na potrzeby osobistego głosu.
Dodaj zgodę użytkownika.
Twórca osobisty głos i uzyskaj identyfikator profilu osoby mówiącej.
Synteza za pomocą zestawu SDK mowy. (Nie jest to część tego interfejsu API. Przeczytaj dokument).

Przykłady

Przykładowy kod niestandardowego interfejsu API głosu

Zobacz też

Struktura swagger niestandardowego interfejsu API głosu
Aby utworzyć zasób usługi Azure Cognitive Service, zobacz Rozpoczynanie pracy z usługą Azure Cognitive Service.

Udostępnij za pośrednictwem