将语音转换为文本
使用 Azure AI 语音 SDK 的语音翻译的模式类似于语音识别,但其中添加了有关翻译的源语言和目标语言的信息:
使用 SpeechTranslationConfig 对象封装在连接到 Azure AI 语音资源时所需的信息。 具体来说,就是它的位置和键。
SpeechTranslationConfig 对象还可用于指定语音识别语言(输入语音的源语言),以及应翻译成的目标语言。
(可选)使用 AudioConfig 定义要转录的音频的输入源。 默认情况下,该输入源是系统默认麦克风,但你也可以指定音频文件。
使用 SpeechTranslationConfig 和 AudioConfig 创建 TranslationRecognizer 对象。 此对象是 Azure AI 语音翻译 API 的代理客户端。
使用 TranslationRecognizer 对象的方法调用基础 API 函数。 例如,RecognizeOnceAsync() 方法使用 Azure AI 语音服务以异步方式翻译单一口述言语。
处理来自 Azure AI 语音的响应。 对于 RecognizeOnceAsync() 方法,结果是一个 SpeechRecognitionResult 对象,它包含以下属性:
- 持续时间
- OffsetInTicks
- 属性
- 原因
- ResultId
- 文本
- 翻译
如果操作成功,则 Reason 属性具有枚举值 RecognizedSpeech,Text 属性包含原始语言的听录。 还可以访问 Translations 属性,它包含翻译的字典(使用两个字符的 ISO 语言代码作为关键字,如“en”表示英语)。