Dokumentacja interfejsu API niestandardowego głosu — Azure Cognitive Services
W tym artykule pokazano, jak wywołać punkt końcowy interfejsu API REST dla usługi Custom Voice , usługi w pakiecie azure Cognitive Services. Niestandardowy głos to funkcja zamiany tekstu na mowę, która umożliwia tworzenie jedną z typów, dostosowanych, syntetycznych głosów dla aplikacji. Dzięki niestandardowemu głosowi możesz utworzyć bardzo naturalny głos dla marki lub znaków, dostarczając próbki mowy ludzkiej jako dane szkoleniowe. Istnieją dwa scenariusze dla niestandardowego głosu: profesjonalny i osobisty. Aby zrozumieć każdy scenariusz i wymagania dotyczące danych, przeczytaj dokumenty dotyczące profesjonalnego i osobistego głosu.
Żądanie dostępu
Zarówno profesjonalny głos, jak i osobisty dostęp do głosu są ograniczone na podstawie kryteriów uprawnień i użycia. Zażądaj dostępu przed użyciem interfejsu API REST.
Tworzenie profesjonalnego głosu
Wywołaj interfejs API REST, wykonując następujące kroki.
- Twórca projekt profesjonalnego głosu.
- Dodaj zgodę na talent głosowy.
- Dodaj profesjonalny zestaw danych do trenowania głosu.
- Trenowanie profesjonalnego modelu głosu.
- Wdróż profesjonalny model głosu jako punkt końcowy.
- Synteza za pomocą zestawu SDK mowy. (Nie jest to część tego interfejsu API. Przeczytaj dokument).
Tworzenie osobistego głosu
Wywołaj interfejs API REST, wykonując następujące kroki.
- Twórca projekt na potrzeby osobistego głosu.
- Dodaj zgodę użytkownika.
- Twórca osobisty głos i uzyskaj identyfikator profilu osoby mówiącej.
- Synteza za pomocą zestawu SDK mowy. (Nie jest to część tego interfejsu API. Przeczytaj dokument).
Przykłady
Przykładowy kod niestandardowego interfejsu API głosu
Zobacz też
- Struktura swagger niestandardowego interfejsu API głosu
- Aby utworzyć zasób usługi Azure Cognitive Service, zobacz Rozpoczynanie pracy z usługą Azure Cognitive Service.