创建连续识别语音转文本应用程序

已完成

在上一个练习中,你了解了如何创建使用单次识别来听录简短音频文件的应用程序。 此应用程序适用于你的医疗客户提供的简短音频备注,但公司需要一个可用于听录客户较长听写文件的应用程序。

考虑到这一点,在下一个练习中,你将修改现有应用程序以使用连续识别,这同时适用于简短备注和较长的听写。 连续识别可以更好地控制语音识别过程,但它需要在应用程序中实现更多代码。

创建使用连续识别来听录音频文件的应用程序

要创建使用 Azure AI 语音连续识别将语音转化为文本的应用程序,你的应用程序必须能够完成以下所有任务:

  • 添加 Microsoft.CognitiveServices.Speech 包。

  • 创建一个从 Azure AI 服务帐户中使用 API 密钥的 SpeechConfig 类。

  • 创建一个将 WAVE 文件用作源的 AudioConfig 类。

  • 创建一个使用 SpeechConfig 类和 AudioConfig 类的 SpeechRecognizer 类。

  • 订阅 SpeechRecognizer 类的以下事件:

    • Recognized 事件检测是否已识别文本。
    • Canceled 事件检测是否已取消识别,这可能是由于错误导致的。
    • SessionStopped 事件检测识别何时停止。
  • 创建一个 StreamWriter 类将转换后的文本写入文件。

  • 调用 SpeechRecognizer 类的 StartContinuousRecognitionAsync() 方法以启动识别,并调用 StopContinuousRecognitionAsync() 方法停止识别。

在下一个练习中,我们将详细了解所有这些步骤。