你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Transcriptions - Transcribe

转录提供的音频流。

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-05-15-preview

URI 参数

名称 必需 类型 说明
audio
formData True

file

binary

音频作为字节流。

definition
formData True

string

快速听录请求的元数据。 此字段包含 TranscribeDefinition类型的 JSON 序列化对象。

endpoint
path True

string

支持的认知服务终结点(协议和主机名,例如:https://westus.api.cognitive.microsoft.com)。

api-version
query True

string

请求的 API 版本。

响应

名称 类型 说明
200 OK

TranscribeResult

还行

安全性

Ocp-Apim-Subscription-Key

在此处提供认知服务帐户密钥。

类型: apiKey
在: header

Authorization

提供来自此区域的 STS 返回的 JWT 的访问令牌。 通过将以下查询字符串添加到 STS URL,确保将管理范围添加到令牌: ?scope=speechservicesmanagement

类型: apiKey
在: header

示例

Transcribe an audio file

示例请求

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-05-15-preview

示例响应

{
  "duration": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offset": 40,
      "duration": 240,
      "text": "Weather",
      "words": [
        {
          "text": "Weather",
          "offset": 40,
          "duration": 240
        }
      ],
      "locale": "en-US",
      "confidence": 0.7881154
    }
  ]
}

定义

名称 说明
CombinedPhrases
Phrase

转录短语。

TranscribeResult

转录操作的结果。

Word

显示窗体中的时间戳单词。

CombinedPhrases

名称 类型 说明
channel

integer

基于 0 的通道索引。 仅当启用了通道分离时,才存在。

text

string

通道的完整转录文本。

Phrase

转录短语。

名称 类型 说明
channel

integer

基于 0 的通道索引。 仅当启用了通道分离时,才存在。

confidence

number

短语的置信度值。

duration

integer

短语的持续时间(以毫秒为单位)。

locale

string

短语的区域设置。

offset

integer

短语的开始偏移量(以毫秒为单位)。

speaker

integer

说话人编号。 仅当启用了说话人分割时,才存在。

text

string

短语的转录文本。

words

Word[]

构成短语的单词。 仅当启用了字级时间戳时,才存在。

TranscribeResult

转录操作的结果。

名称 类型 说明
combinedPhrases

CombinedPhrases[]

每个通道的组合听录结果。

duration

integer

音频的持续时间(以毫秒为单位)。

phrases

Phrase[]

听录结果分为短语。

Word

显示窗体中的时间戳单词。

名称 类型 说明
duration

integer

单词的持续时间(以毫秒为单位)。

offset

integer

单词的起始偏移量(以毫秒为单位)。

text

string

已识别的单词,包括标点符号。