Introduktion

Slutförd

Azure AI Speech tillhandahåller API:er som du kan använda för att skapa talaktiverade program. Detta omfattar:

  • Tal till text: Ett API som möjliggör taligenkänning där ditt program kan acceptera talade indata.
  • Text till tal: Ett API som möjliggör talsyntes där ditt program kan tillhandahålla talade utdata.
  • Talöversättning: Ett API som du kan använda för att översätta talade indata till flera språk.
  • Talarigenkänning: Ett API som gör det möjligt för ditt program att känna igen enskilda talare baserat på deras röst.
  • Avsiktsigenkänning: Ett API som använder förståelse för konversationsspråk för att fastställa den semantiska innebörden av talade indata.

Den här modulen fokuserar på taligenkänning och talsyntes, som är kärnfunktioner i alla talaktiverade program.

I den här modulen kommer du att:

  • Etablera en Azure-resurs för Azure AI Speech-tjänsten
  • Använda API:et Tal till text för att implementera taligenkänning
  • Använda API:et text till tal för att implementera talsyntes
  • Konfigurera ljudformat och röster
  • Använda Speech Synthesis Markup Language (SSML)

Enheterna i modulen innehåller viktig konceptuell information om Azure AI Speech och hur du använder dess API via något av de programutvecklingspaket som stöds, varefter du kan prova Azure AI Speech själv i en praktisk övning. För att slutföra den praktiska övningen behöver du en Microsoft Azure-prenumeration. Om du inte redan har en sådan kan du registrera dig för en kostnadsfri utvärderingsversion på https://azure.com/free.