Introduktion

2 minuter

Azure AI Speech tillhandahåller API:er som du kan använda för att skapa talaktiverade program. Detta omfattar:

Tal till text: Ett API som möjliggör taligenkänning där ditt program kan acceptera talade indata.
Text till tal: Ett API som möjliggör talsyntes där ditt program kan tillhandahålla talade utdata.
Talöversättning: Ett API som du kan använda för att översätta talade indata till flera språk.
Talarigenkänning: Ett API som gör det möjligt för ditt program att känna igen enskilda talare baserat på deras röst.
Avsiktsigenkänning: Ett API som använder förståelse för konversationsspråk för att fastställa den semantiska innebörden av talade indata.

Den här modulen fokuserar på taligenkänning och talsyntes, som är kärnfunktioner i alla talaktiverade program.

I den här modulen kommer du att:

Etablera en Azure-resurs för Azure AI Speech-tjänsten
Använda API:et Tal till text för att implementera taligenkänning
Använda API:et text till tal för att implementera talsyntes
Konfigurera ljudformat och röster
Använda Speech Synthesis Markup Language (SSML)

Enheterna i modulen innehåller viktig konceptuell information om Azure AI Speech och hur du använder dess API via något av de programutvecklingspaket som stöds, varefter du kan prova Azure AI Speech själv i en praktisk övning. För att slutföra den praktiska övningen behöver du en Microsoft Azure-prenumeration. Om du inte redan har en sådan kan du registrera dig för en kostnadsfri utvärderingsversion på https://azure.com/free.

Introduktion

Feedback