创建单次识别语音转文本应用程序

已完成

在上一练习中,你学习了如何使用 Azure CLI 创建 Azure AI 服务帐户。 现在,你已经有一个 Azure AI 服务帐户可供使用,接下来可开始处理语音转文本应用程序。

你的第一个挑战是创建一个应用程序,供你的公司用来转录医疗客户的简短备忘录。 Azure AI 服务提供两种可在开发中使用的不同类型的语音识别:

  • 单步识别

    • 单次识别可侦听声音中的停顿,之后会停止识别,并且最多只能处理 15 秒的语音。

    • 这种类型的识别对于公司医疗客户提供的简短备忘录非常有效,但它不适用于较长的口述内容。

    • 单次识别更易于在应用程序中实现,但相对更难控制。

  • 连续识别

    • 持续识别可持续侦听到识别结束。

    • 这种类型的识别对简短的备忘录和较长的口述内容均有较好的使用效果。

    • 持续识别需要你在应用程序中实现更多代码,但会更好控制。

在下一练习中,你将使用单次识别来创建一个可用于转录公司医疗客户的简短备忘录的应用程序。 在本模块的后面部分,你将使用连续识别来创建一个应用程序,用于转录简短的备忘录和较长的口述。

创建使用单次识别来转录音频文件的应用程序

若要创建使用 Azure AI 语音的单次识别将语音转文本的应用程序,应用程序必须能够完成以下所有任务:

  • 添加 Microsoft.CognitiveServices.Speech 包。

  • 创建一个从 Azure AI 服务帐户中使用 API 密钥的 SpeechConfig 类。

  • 创建一个将 WAVE 文件用作源的 AudioConfig 类。

  • 创建一个使用 SpeechConfig 类和 AudioConfig 类的 SpeechRecognizer 类。

  • 调用 SpeechRecognizer 类的 RecognizeOnceAsync() 方法将语音转换为文本。

  • 创建一个 StreamWriter 类将转换后的文本写入文件。

在下一个练习中,我们将详细了解所有这些步骤。