Vytvoření převodu řeči na textovou aplikaci s průběžným rozpoznáváním
V předchozím cvičení jste se dozvěděli, jak vytvořit aplikaci, která k přepisu krátkých zvukových souborů použila rozpoznávání s jedním snímkem. Tato aplikace dobře fungovala pro stručné zvukové poznámky, které poskytli vaši zdravotní klienti, ale vaše společnost potřebuje aplikaci, kterou můžete použít k přepisování delších diktačních souborů klientů.
V dalším cvičení upravíte stávající aplikaci tak, aby používala průběžné rozpoznávání, které funguje pro stručné poznámky i delší diktování. Nepřetržité rozpoznávání vám dává větší kontrolu nad procesem rozpoznávání řeči, ale vyžaduje více kódu pro implementaci ve vaší aplikaci.
Vytvoření aplikace s využitím průběžného rozpoznávání pro přepis zvukových souborů
Pokud chcete vytvořit aplikaci, která bude převádět řeč na text pomocí průběžného rozpoznávání služby Azure AI Speech, bude muset vaše aplikace provádět všechny následující úlohy:
Zahrňte
Microsoft.CognitiveServices.Speech
balíček.Vytvořte
SpeechConfig
třídu pomocí klíče rozhraní API z účtu služeb Azure AI.Vytvořte
AudioConfig
třídu pomocí souboru WAVE jako zdroje.Vytvořte
SpeechRecognizer
třídu pomocí třídySpeechConfig
aAudioConfig
tříd.Přihlaste se k odběru
SpeechRecognizer
následujících událostí třídy:- Událost
Recognized
rozpozná, jestli byl rozpoznán text. - Událost
Canceled
zjistí, jestli bylo rozpoznávání zrušeno, což může být způsobeno chybou. - Událost
SessionStopped
zjistí, kdy se rozpoznávání zastavilo.
- Událost
Vytvořte
StreamWriter
třídu pro zápis převedeného textu do souboru.StartContinuousRecognitionAsync()
Vyvolá metoduSpeechRecognizer
třídy pro spuštění rozpoznávání a metoduStopContinuousRecognitionAsync()
zastavení rozpoznávání.
V dalším cvičení se podrobněji podíváme na všechny tyto kroky.