Vytvoření převodu řeči na textovou aplikaci s průběžným rozpoznáváním

Dokončeno

V předchozím cvičení jste se dozvěděli, jak vytvořit aplikaci, která k přepisu krátkých zvukových souborů použila rozpoznávání s jedním snímkem. Tato aplikace dobře fungovala pro stručné zvukové poznámky, které poskytli vaši zdravotní klienti, ale vaše společnost potřebuje aplikaci, kterou můžete použít k přepisování delších diktačních souborů klientů.

V dalším cvičení upravíte stávající aplikaci tak, aby používala průběžné rozpoznávání, které funguje pro stručné poznámky i delší diktování. Nepřetržité rozpoznávání vám dává větší kontrolu nad procesem rozpoznávání řeči, ale vyžaduje více kódu pro implementaci ve vaší aplikaci.

Vytvoření aplikace s využitím průběžného rozpoznávání pro přepis zvukových souborů

Pokud chcete vytvořit aplikaci, která bude převádět řeč na text pomocí průběžného rozpoznávání služby Azure AI Speech, bude muset vaše aplikace provádět všechny následující úlohy:

  • Zahrňte Microsoft.CognitiveServices.Speech balíček.

  • Vytvořte SpeechConfig třídu pomocí klíče rozhraní API z účtu služeb Azure AI.

  • Vytvořte AudioConfig třídu pomocí souboru WAVE jako zdroje.

  • Vytvořte SpeechRecognizer třídu pomocí třídy SpeechConfig a AudioConfig tříd.

  • Přihlaste se k odběru SpeechRecognizer následujících událostí třídy:

    • Událost Recognized rozpozná, jestli byl rozpoznán text.
    • Událost Canceled zjistí, jestli bylo rozpoznávání zrušeno, což může být způsobeno chybou.
    • Událost SessionStopped zjistí, kdy se rozpoznávání zastavilo.
  • Vytvořte StreamWriter třídu pro zápis převedeného textu do souboru.

  • StartContinuousRecognitionAsync() Vyvolá metodu SpeechRecognizer třídy pro spuštění rozpoznávání a metodu StopContinuousRecognitionAsync() zastavení rozpoznávání.

V dalším cvičení se podrobněji podíváme na všechny tyto kroky.