介绍
Azure AI 语音提供可用于生成启用语音的应用程序的 API。 这包括:
- 语音转文本:一种实现语音识别的 API,应用程序在其中可以接受口述输入。
- 文本转语音:一种实现语音合成的 API,应用程序可在其中提供口述输出。
- 语音翻译:一种可以用于将口述输入翻译为多种语言的 API。
- 说话人识别:一种使应用程序可以基于其语音识别各个说话人的 API。
- 意向识别:一种使用对话语言理解的 API,用于确定口述输入的语义含义。
本模块重点介绍语音识别和语音合成,它们是任何启用了语音的应用程序的核心功能。
在本模块中,您将了解如何:
- 为 Azure AI 语音服务预配 Azure 资源
- 使用语音转文本 API 实现语音识别
- 使用文本转语音 API 实现语音合成
- 配置音频格式和语音
- 使用语音合成标记语言 (SSML)
本模块中的单元包含有关 Azure AI 语音的重要概念信息,以及如何通过受支持的软件开发工具包 (SDK) 之一使用其 API。学完本模块后,你将能够在实践练习中亲自试用 Azure AI 语音。 若要完成实践练习,你将需要 Microsoft Azure 订阅。 如果你还没有,可在 https://azure.com/free 注册免费试用版。