Introduktion
Azure AI Speech tillhandahåller API:er som du kan använda för att skapa talaktiverade program. Detta omfattar:
- Tal till text: Ett API som möjliggör taligenkänning där ditt program kan acceptera talade indata.
- Text till tal: Ett API som möjliggör talsyntes där ditt program kan tillhandahålla talade utdata.
- Talöversättning: Ett API som du kan använda för att översätta talade indata till flera språk.
- Talarigenkänning: Ett API som gör det möjligt för ditt program att känna igen enskilda talare baserat på deras röst.
- Avsiktsigenkänning: Ett API som använder förståelse för konversationsspråk för att fastställa den semantiska innebörden av talade indata.
Den här modulen fokuserar på taligenkänning och talsyntes, som är kärnfunktioner i alla talaktiverade program.
I den här modulen kommer du att:
- Etablera en Azure-resurs för Azure AI Speech-tjänsten
- Använda API:et Tal till text för att implementera taligenkänning
- Använda API:et text till tal för att implementera talsyntes
- Konfigurera ljudformat och röster
- Använda Speech Synthesis Markup Language (SSML)
Enheterna i modulen innehåller viktig konceptuell information om Azure AI Speech och hur du använder dess API via något av de programutvecklingspaket som stöds, varefter du kan prova Azure AI Speech själv i en praktisk övning. För att slutföra den praktiska övningen behöver du en Microsoft Azure-prenumeration. Om du inte redan har en sådan kan du registrera dig för en kostnadsfri utvärderingsversion på https://azure.com/free.