Co je osobní hlas pro převod textu na řeč?

Článek
10/16/2024

Pomocí osobního hlasu můžete uživatelům povolit, aby během několika sekund získali replikaci vlastních hlasů vygenerovanou pomocí umělé inteligence. Pomocí slovního příkazu a krátké ukázky řeči jako hlasové výzvy můžete pro uživatele vytvořit osobní hlas a umožnit jim generovat řeč v libovolném z více než 90 jazyků podporovaných ve více než 100 národních prostředích.

Poznámka:

Osobní hlas je k dispozici v těchto oblastech: Západní Evropa, USA – východ a Jihovýchodní Asie. Podporovaná národní prostředí najdete v tématu podpora jazyka osobního hlasu.

Následující tabulka shrnuje rozdíl mezi osobním hlasem a profesionálním vlastním neurálním hlasem.

Porovnání	Osobní hlas	Profesionální hlas
Cílové scénáře	Podnikoví zákazníci můžou vytvořit aplikaci, která uživatelům umožní vytvářet a používat vlastní osobní hlas v aplikaci.	Profesionální scénáře, jako jsou hlasy značek a znaků pro chatovací roboty nebo čtení zvukového obsahu.
Případy použití	Omezeno na omezené případy použití. Podívejte se na poznámku transparentnosti. Schválení zákazníci by měli mít plán podpory více než 1 000 osobních hlasů.	Omezeno na omezené případy použití. Podívejte se na poznámku transparentnosti.
Data pro trénink	Ujistěte se, že dodržujete pravidla chování.	Přineste si vlastní data. Doporučuje se nahrávání v profesionálním studiu.
Požadovaná velikost dat	Jedna minuta lidské řeči.	300–2000 promluv (asi 30 minut až 3 hodiny lidské řeči).
Doba trénování	Méně než 5 sekund	Přibližně 20 až 40 výpočetních hodin.
Kvalita hlasu	Přirozený	Vysoce přírodní
Podpora více jazyků	Ano. Hlas dokáže mluvit o 100 jazycích s povolenou automatickou detekcí jazyka.	Ano. Pokud chcete vytrénovat model, který mluví jiným jazykem než trénovací data, musíte vybrat funkci Neurální – křížový jazyk.
Dostupnost	Ukázka v sadě Speech Studio je k dispozici po registraci. Přístup k rozhraní API je omezený na oprávněné zákazníky a schválené případy použití. Požádejte o přístup prostřednictvím formuláře pro příjem.	Model CNV Pro můžete trénovat a nasazovat pouze po schválení přístupu. Přístup CNV Pro je omezený na základě kritérií způsobilosti a použití. Požádejte o přístup prostřednictvím formuláře pro příjem.
Ceny	Podrobnosti o cenách najdete tady¹.	Podrobnosti o cenách najdete tady.
Zodpovědné požadavky na AI	Vyžaduje se ústní prohlášení mluvčího. Nejsou povoleny žádné neschválené případy použití.	Vyžaduje se ústní prohlášení mluvčího. Nejsou povoleny žádné neschválené případy použití.

^{1 Mějte} na paměti, že ceny osobních hlasových služeb budou viditelné jenom pro oblasti služeb, ve kterých je tato funkce dostupná, včetně západní Evropy, USA – východ a Jihovýchodní Asie.

Vyzkoušet ukázkovou verzi

Pokud máte prostředek S0, můžete získat přístup k osobní ukázce hlasu v sadě Speech Studio. Pokud chcete použít osobní hlasové rozhraní API, můžete požádat o přístup zde.

Přejít do sady Speech Studio
Vyberte osobní hlasovou kartu.
Můžete nahrát vlastní hlas a vyzkoušet ukázky hlasových výstupů v různých jazycích. Ukázka obsahuje podmnožinu jazyků podporovaných osobním hlasem.

Jak vytvořit osobní hlas

Začněte tím, že tady je souhrn kroků pro vytvoření osobního hlasu:

Vytvořte projekt.
Nahrání souboru souhlasu U funkce osobního hlasu je nutné, aby se každý hlas vytvořil s výslovným souhlasem uživatele. Vyžaduje se zaznamenané prohlášení od uživatele s potvrzením, že zákazník (vlastník prostředku Azure AI Speech) vytvoří a použije svůj hlas.
Získejte ID profilu mluvčího pro osobní hlas. Id profilu mluvčího získáte na základě ústního vyjádření souhlasu mluvčího a zvukové výzvy. Vlastnosti hlasu uživatele jsou kódovány ve speakerProfileId vlastnosti, která se používá pro převod textu na řeč.

Jakmile budete mít osobní hlas, můžete ho použít k syntetizaci řeči v libovolném z 91 jazyků podporovaných ve více než 100 národních prostředích. Značka národního prostředí není povinná. Osobní hlas používá automatické rozpoznávání jazyka na úrovni věty. Další informace najdete v tématu Použití osobního hlasu v aplikaci.

Tip

Podívejte se na ukázky kódu v úložišti Speech SDK na GitHubu a podívejte se, jak používat osobní hlas ve vaší aplikaci.

Referenční dokumentace

Referenční dokumentace k rozhraní REST API pro vlastní hlas

Zodpovědná AI

Záleží nám na lidech, kteří používají AI, a o lidi, na které bude mít vliv stejně jako na technologie. Další informace najdete v poznámkách k transparentnosti zodpovědné umělé inteligence.

Další kroky

Vytvořte projekt.
Další informace o vlastním neurálním hlasu najdete v přehledu.
Další informace o sadě Speech Studio najdete v přehledu.

Sdílet prostřednictvím