介绍

2 分钟

Azure AI 语音提供可用于生成启用语音的应用程序的 API。这包括：

语音转文本：一种实现语音识别的 API，应用程序在其中可以接受口述输入。
文本转语音：一种实现语音合成的 API，应用程序可在其中提供口述输出。
语音翻译：一种可以用于将口述输入翻译为多种语言的 API。
说话人识别：一种使应用程序可以基于其语音识别各个说话人的 API。
意向识别：一种使用对话语言理解的 API，用于确定口述输入的语义含义。

本模块重点介绍语音识别和语音合成，它们是任何启用了语音的应用程序的核心功能。

在本模块中，您将了解如何：

为 Azure AI 语音服务预配 Azure 资源
使用语音转文本 API 实现语音识别
使用文本转语音 API 实现语音合成
配置音频格式和语音
使用语音合成标记语言 (SSML)

本模块中的单元包含有关 Azure AI 语音的重要概念信息，以及如何通过受支持的软件开发工具包 (SDK) 之一使用其 API。学完本模块后，你将能够在实践练习中亲自试用 Azure AI 语音。若要完成实践练习，你将需要 Microsoft Azure 订阅。如果你还没有，可在 https://azure.com/free 注册免费试用版。

介绍

反馈