你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Jobs - Create

创建作业
创建作业。

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Media/mediaServices/{accountName}/transforms/{transformName}/jobs/{jobName}?api-version=2022-07-01

URI 参数

名称 必需 类型 说明
accountName
path True

string

媒体服务帐户名称。

jobName
path True

string

作业名称。

resourceGroupName
path True

string

Azure 订阅中的资源组的名称。

subscriptionId
path True

string

Microsoft Azure 订阅的唯一标识符。

transformName
path True

string

转换名称。

api-version
query True

string

要与客户端请求一起使用的 API 版本。

请求正文

名称 必需 类型 说明
properties.input True JobInput:

作业的输入。

properties.outputs True JobOutput[]:

JobOutputAsset[]

作业的输出。

properties.correlationData

object

客户提供的密钥、值对将在作业和 JobOutput 状态事件中返回。

properties.description

string

客户为作业提供的说明(可选)。

properties.priority

Priority

处理作业的优先级。 较高优先级的作业在较低优先级的作业之前处理。 如果未设置,则默认为正常。

响应

名称 类型 说明
201 Created

Job

创建

Other Status Codes

ErrorResponse

详细的错误信息。

示例

Create a Job

示例请求

PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaServices/contosomedia/transforms/exampleTransform/jobs/job1?api-version=2022-07-01

{
  "properties": {
    "input": {
      "@odata.type": "#Microsoft.Media.JobInputAsset",
      "assetName": "job1-InputAsset"
    },
    "outputs": [
      {
        "@odata.type": "#Microsoft.Media.JobOutputAsset",
        "assetName": "job1-OutputAsset"
      }
    ],
    "correlationData": {
      "key1": "value1",
      "Key 2": "Value 2"
    }
  }
}

示例响应

{
  "name": "job1",
  "id": "/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/exampleTransform/jobs/job1",
  "type": "Microsoft.Media/mediaservices/transforms/jobs",
  "properties": {
    "created": "2022-10-17T23:14:33.6140749Z",
    "state": "Queued",
    "input": {
      "@odata.type": "#Microsoft.Media.JobInputAsset",
      "files": [],
      "inputDefinitions": [],
      "assetName": "job1-InputAsset"
    },
    "lastModified": "2022-10-17T23:14:33.6140749Z",
    "outputs": [
      {
        "@odata.type": "#Microsoft.Media.JobOutputAsset",
        "state": "Queued",
        "progress": 0,
        "label": "BuiltInStandardEncoderPreset_0",
        "assetName": "job1-OutputAsset"
      }
    ],
    "priority": "Normal",
    "correlationData": {
      "key1": "value1",
      "Key 2": "Value 2"
    }
  },
  "systemData": {
    "createdBy": "contoso@microsoft.com",
    "createdByType": "User",
    "createdAt": "2022-10-17T23:14:33.6140749Z",
    "lastModifiedBy": "contoso@microsoft.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2022-10-17T23:14:33.6140749Z"
  }
}

定义

名称 说明
AacAudio

介绍高级音频编解码器 (AAC) 音频编码设置。

AacAudioProfile

使用 AAC 对音频进行编码时要使用的编码配置文件。

AbsoluteClipTime

将剪辑时间指定为媒体文件中的绝对时间位置。 绝对时间可以指向不同的位置,具体取决于媒体文件是否从时间戳零开始。

AnalysisResolution

指定分析视频时的最大分辨率。 默认行为为“SourceResolution”,它将在分析时将输入视频保持其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频的分辨率更高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。 它还可以减少使用此组件的成本, (有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics) 。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。

AttributeFilter

要应用于 TrackAttribute 以便选择轨的 AttributeFilter 的类型。

Audio

定义所有音频编解码器的通用属性。

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。

AudioAnalyzerPreset

音频分析器预设应用一组预定义的基于 AI 的分析操作,包括语音听录。 目前,该预设支持处理单个音轨的内容。

AudioOverlay

描述音频覆盖的属性。

AudioTrackDescriptor

用于选择音轨的 TrackSelection。

BlurType

模糊类型

BuiltInStandardEncoderPreset

介绍用于使用标准编码器对输入视频进行编码的内置预设。

ChannelMapping

单声道音轨的可选指定。 可用于将音轨合并成立体声或多声道音频轨。

Complexity

可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将“复杂性”设置为“速度”,以加快编码速度,但降低压缩效率。

CopyAudio

一个编解码器标志,指示编码器复制输入音频比特流。

CopyVideo

一个编解码器标志,指示编码器在不重新编码的情况下复制输入视频比特流。

createdByType

创建资源的标识类型。

DDAudio

介绍杜比数字音频编解码器 (AC3) 音频编码设置。 Dolby Digital Audio 支持的当前实现是:1 ( (单声道) 、2 (立体声) 、6 (5.1 边) ;音频采样频率速率:32K/44.1K/48K Hz;AC3 规范支持的音频比特率值:32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。

Deinterlace

描述反交错设置。

DeinterlaceMode

去交错模式。 默认为 AutoPixelAdaptive。

DeinterlaceParity

用于去交错的字段奇偶校验,默认为“自动”。

EncoderNamedPreset

用于编码视频的内置预设。

EntropyMode

要用于此层的熵模式。 如果未指定,编码器会选择适合配置文件和级别的模式。

ErrorAdditionalInfo

资源管理错误附加信息。

ErrorDetail

错误详细信息。

ErrorResponse

错误响应

FaceDetectorPreset

描述分析视频时要使用的所有设置,以便检测 (并选择性地编辑) 存在的所有人脸。

FaceRedactorMode

此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件,该文件标记整个视频中人脸的外观。如果可能,为同一人的外观分配相同的 ID。2) 组合 - 此外, (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次通过过程,允许对检测到的人脸的子集进行选择性编辑。它从以前的分析阶段获取元数据文件,以及源视频,以及用户选择的需要修订的 ID 子集。

Fade

描述应用于输入媒体的淡化效果的属性。

Filters

描述在编码之前应用于输入媒体的所有筛选操作,例如去交错、旋转等。

FromAllInputFile

一个 InputDefinition,用于查找提供的所有文件,以选择由 IncludedTracks 属性指定的曲目。 通常与 AudioTrackByAttribute 和 VideoTrackByAttribute 一起使用,以允许跨一组输入文件选择单个曲目。

FromEachInputFile

一个 InputDefinition,用于查看提供的每个输入文件,以选择由 IncludedTracks 属性指定的曲目。 通常与 AudioTrackByAttribute 和 VideoTrackByAttribute 一起使用,以便从给定的每个文件中选择曲目。

H264Complexity

告知编码器如何选择其编码设置。 默认值为“平衡”。

H264Layer

描述在使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

H264RateControlMode

视频速率控制模式

H264Video

描述使用 H.264 编解码器对视频进行编码的所有属性。

H264VideoProfile

我们目前支持基线、主、高、高、高422、高444。 默认值为“自动”。

H265Complexity

告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快且更经济。 默认值为 Balanced。

H265Layer

介绍在使用 H.265 视频编解码器将输入视频编码为所需的输出比特率层时要使用的设置。

H265Video

描述使用 H.265 编解码器对视频进行编码的所有属性。

H265VideoProfile

我们目前支持 Main。 默认值为“自动”。

Image

介绍用于从输入视频生成缩略图的基本属性

ImageFormat

描述输出图像文件的属性。

InputFile

单个文件的 InputDefinition。 TrackSelections 的范围限定为指定的文件。

InsightsType

定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅视频,则仅生成视频见解。 如果你希望某些输入仅使用视频,建议不要使用 AudioInsightsOnly;或者,如果你希望某些输入仅是音频,请使用 VideoInsightsOnly。 在这种情况下,作业将出错。

InterleaveOutput

设置输出的交错模式,以控制以容器格式存储音频和视频的方式。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅限音频和仅视频的输出。

Job

作业资源类型。 可以通过轮询作业或使用 EventGrid 订阅事件来获取进度和状态。

JobError

JobOutput 错误的详细信息。

JobErrorCategory

帮助对错误进行分类。

JobErrorCode

描述错误的错误代码。

JobErrorDetail

JobOutput 错误的详细信息。

JobInputAsset

表示要输入到作业中的资产。

JobInputClip

表示作业的输入文件。

JobInputHttp

表示 HTTPS 作业输入。

JobInputs

描述作业的输入列表。

JobInputSequence

序列包含剪辑的有序列表,其中每个剪辑都是 JobInput。 序列将被视为单个输入。

JobOutputAsset

表示用作 JobOutput 的资产。

JobRetry

指示可以重试作业。 如果重试失败,请通过 Azure 门户联系 Azure 支持。

JobState

描述 JobOutput 的状态。

JpgFormat

描述用于生成 JPEG 缩略图的设置。

JpgImage

描述用于从输入视频生成一系列 JPEG 图像的属性。

JpgLayer

描述从输入视频生成 JPEG 图像的设置。

Mp4Format

描述输出 ISO MP4 文件的属性。

MultiBitrateFormat

描述用于生成 GOP 对齐的多比特率文件集合的属性。 默认行为是为每个视频层生成一个输出文件,该文件与所有音频一起复用。 可以通过指定 outputFiles 集合来控制生成的确切输出文件。

OutputFile

表示生成的输出文件。

PngFormat

描述用于生成 PNG 缩略图的设置。

PngImage

描述用于从输入视频生成一系列 PNG 图像的属性。

PngLayer

描述从输入视频生成 PNG 图像的设置。

PresetConfigurations

编码器的可选配置设置的对象。

Priority

设置转换中 TransformOutputs 的相对优先级。 这将设置服务用于处理 TransformOutput 的优先级。 默认优先级为 Normal。

Rectangle

描述在处理输入媒体之前应用于输入媒体的矩形窗口的属性。

Rotation

在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为 Auto

SelectAudioTrackByAttribute

通过指定属性和属性筛选器,从输入中选择音轨。

SelectAudioTrackById

通过指定音轨标识符从输入中选择音轨。

SelectVideoTrackByAttribute

通过指定属性和属性筛选器,从输入中选择视频轨道。

SelectVideoTrackById

通过指定曲目标识符从输入中选择视频轨道。

StandardEncoderPreset

介绍使用标准编码器对输入视频进行编码时要使用的所有设置。

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

systemData

与资源的创建和上次修改相关的元数据。

TrackAttribute

用于筛选跟踪的 TrackAttribute。

TransportStreamFormat

介绍用于生成 MPEG-2 传输流 (ISO/IEC 13818-1) 输出视频文件 () 的属性。

UtcClipTime

将剪辑时间指定为媒体文件中的 Utc 时间位置。 Utc 时间可以指向不同的位置,具体取决于媒体文件是否从时间戳零开始。

Video

介绍用于编码输入视频的基本属性。

VideoAnalyzerPreset

视频分析器预设,用于从音频和视频提取见解 (丰富的元数据) ,并输出 JSON 格式化文件。

VideoOverlay

描述视频覆盖的属性。

VideoSyncMode

视频同步模式

VideoTrackDescriptor

用于选择视频轨道的 TrackSelection。

AacAudio

介绍高级音频编解码器 (AAC) 音频编码设置。

名称 类型 说明
@odata.type string:

#Microsoft.Media.AacAudio

派生类型的鉴别器。

bitrate

integer

输出编码音频的比特率(以位/秒为单位)。

channels

integer

音频中的声道数。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

profile

AacAudioProfile

使用 AAC 编码音频时要使用的编码配置文件。

samplingRate

integer

用于以赫为单位编码的采样率。

AacAudioProfile

使用 AAC 对音频进行编码时要使用的编码配置文件。

名称 类型 说明
AacLc

string

指定要将输出音频编码为 AAC 低复杂性配置文件 (AAC-LC) 。

HeAacV1

string

指定输出音频要编码为 HE-AAC v1 配置文件。

HeAacV2

string

指定输出音频要编码为 HE-AAC v2 配置文件。

AbsoluteClipTime

将剪辑时间指定为媒体文件中的绝对时间位置。 绝对时间可以指向不同的位置,具体取决于媒体文件是否从时间戳零开始。

名称 类型 说明
@odata.type string:

#Microsoft.Media.AbsoluteClipTime

派生类型的鉴别器。

time

string

输入媒体时间线的时间位置。 它通常指定为ISO8601期。 例如 PT30S 30 秒。

AnalysisResolution

指定分析视频时的最大分辨率。 默认行为为“SourceResolution”,它将在分析时将输入视频保持其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频的分辨率更高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。 它还可以减少使用此组件的成本, (有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics) 。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。

名称 类型 说明
SourceResolution

string

StandardDefinition

string

AttributeFilter

要应用于 TrackAttribute 以便选择轨的 AttributeFilter 的类型。

名称 类型 说明
All

string

将包含所有曲目。

Bottom

string

当属性按升序排序时,将包含第一个轨迹。 通常用于选择最小比特率。

Top

string

当属性按降序排序时,将包含第一个轨迹。 通常用于选择最大比特率。

ValueEquals

string

将包含属性等于给定值的任何轨迹。

Audio

定义所有音频编解码器的通用属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.Audio

派生类型的鉴别器。

bitrate

integer

输出编码音频的比特率(以位/秒为单位)。

channels

integer

音频中的声道数。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

samplingRate

integer

用于以赫为单位编码的采样率。

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。

名称 类型 说明
Basic

string

此模式执行语音转文本听录并生成 VTT 字幕文件。 此模式的输出包括一个见解 JSON 文件,该文件仅包含关键字、听录和计时信息。 此模式不包括自动语言检测和说话人分割聚类。

Standard

string

执行基本模式中包含的所有操作,此外还执行语言检测和说话人分割。

AudioAnalyzerPreset

音频分析器预设应用一组预定义的基于 AI 的分析操作,包括语音听录。 目前,该预设支持处理单个音轨的内容。

名称 类型 说明
@odata.type string:

#Microsoft.Media.AudioAnalyzerPreset

派生类型的鉴别器。

audioLanguage

string

使用“语言标记区域”的 BCP-47 格式的输入中的音频有效负载的语言 (例如:“en-US”) 。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为自动语言检测不包括在基本模式下。 如果未指定语言或将语言设置为 null,自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。 它目前不支持在检测到第一种语言后在各语言之间进行动态切换。 自动检测最适用于具有清晰可辨识语音的录音。 如果自动检测找不到语言,听录将回退到'en-US'。此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463

experimentalOptions

object

包含未在预设本身中公开的参数的键值对的字典

mode

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。

AudioOverlay

描述音频覆盖的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.AudioOverlay

派生类型的鉴别器。

audioGainLevel

number

覆盖中音频的增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。

end

string

结束位置,以及对输入视频的引用,覆盖的结束位置。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频的 30 秒处结束覆盖。 如果未指定或值大于输入视频持续时间,则覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。

fadeInDuration

string

覆盖淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是无淡入 (与 PT0S) 相同。

fadeOutDuration

string

覆盖淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是没有淡出 (与 PT0S) 相同。

inputLabel

string

要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件,或者指定音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件。 有关支持的音频和视频文件格式的完整列表,请参阅 https://aka.ms/mesformats

start

string

开始位置,以及对输入视频的引用,覆盖层从该位置开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频的 5 秒处开始覆盖。 如果未指定,则覆盖层从输入视频的开头开始。

AudioTrackDescriptor

用于选择音轨的 TrackSelection。

名称 类型 说明
@odata.type string:

#Microsoft.Media.AudioTrackDescriptor

派生类型的鉴别器。

channelMapping

ChannelMapping

单声道音轨的可选指定。 可用于将音轨合并成立体声或多声道音频轨。

BlurType

模糊类型

名称 类型 说明
Black

string

黑色:遮光筛选器

Box

string

Box:调试筛选器,仅边界框

High

string

高:混淆模糊筛选器

Low

string

低:盒车模糊滤镜

Med

string

Med:高斯模糊筛选器

BuiltInStandardEncoderPreset

介绍用于使用标准编码器对输入视频进行编码的内置预设。

名称 类型 说明
@odata.type string:

#Microsoft.Media.BuiltInStandardEncoderPreset

派生类型的鉴别器。

configurations

PresetConfigurations

编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。

presetName

EncoderNamedPreset

用于编码视频的内置预设。

ChannelMapping

单声道音轨的可选指定。 可用于将音轨合并成立体声或多声道音频轨。

名称 类型 说明
BackLeft

string

后向左通道。 有时称为左环绕声道。

BackRight

string

后向右通道。 有时称为右环绕声道。

Center

string

中心通道。

FrontLeft

string

左前通道。

FrontRight

string

右前通道。

LowFrequencyEffects

string

低频效果通道。 有时称为低音炮。

StereoLeft

string

左立体声声道。 有时称为向下混合左。

StereoRight

string

右立体声通道。 有时称为向下混合右。

Complexity

可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将“复杂性”设置为“速度”,以加快编码速度,但降低压缩效率。

名称 类型 说明
Balanced

string

将编码器配置为使用在速度和质量之间实现平衡的设置。

Quality

string

将编码器配置为使用经过优化的设置,以生成更高质量的输出,但代价是总体编码时间变慢。

Speed

string

将编码器配置为使用为加快编码速度而优化的设置。 为了缩短编码时间,会牺牲质量。

CopyAudio

一个编解码器标志,指示编码器复制输入音频比特流。

名称 类型 说明
@odata.type string:

#Microsoft.Media.CopyAudio

派生类型的鉴别器。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

CopyVideo

一个编解码器标志,指示编码器在不重新编码的情况下复制输入视频比特流。

名称 类型 说明
@odata.type string:

#Microsoft.Media.CopyVideo

派生类型的鉴别器。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

createdByType

创建资源的标识类型。

名称 类型 说明
Application

string

Key

string

ManagedIdentity

string

User

string

DDAudio

介绍杜比数字音频编解码器 (AC3) 音频编码设置。 Dolby Digital Audio 支持的当前实现是:1 ( (单声道) 、2 (立体声) 、6 (5.1 边) ;音频采样频率速率:32K/44.1K/48K Hz;AC3 规范支持的音频比特率值:32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。

名称 类型 说明
@odata.type string:

#Microsoft.Media.DDAudio

派生类型的鉴别器。

bitrate

integer

输出编码音频的比特率(以位/秒为单位)。

channels

integer

音频中的声道数。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

samplingRate

integer

用于以赫为单位编码的采样率。

Deinterlace

描述反交错设置。

名称 类型 说明
mode

DeinterlaceMode

去交错模式。 默认为 AutoPixelAdaptive。

parity

DeinterlaceParity

用于去交错的字段奇偶校验,默认为“自动”。

DeinterlaceMode

去交错模式。 默认为 AutoPixelAdaptive。

名称 类型 说明
AutoPixelAdaptive

string

对输入视频中的每个帧应用自动像素自适应去交错。

Off

string

禁用源视频的反交错。

DeinterlaceParity

用于去交错的字段奇偶校验,默认为“自动”。

名称 类型 说明
Auto

string

自动检测字段的顺序

BottomFieldFirst

string

应用底部字段首先处理输入视频。

TopFieldFirst

string

应用 top field first 处理输入视频。

EncoderNamedPreset

用于编码视频的内置预设。

名称 类型 说明
AACGoodQualityAudio

string

生成仅包含以 192 kbps 编码的 AAC 立体声音频的单个 MP4 文件。

AdaptiveStreaming

string

使用 H.264 视频和立体声 AAC 音频生成一组 GOP 对齐的 MP4 文件。 根据输入分辨率、比特率和帧速率自动生成比特率阶梯。 自动生成的预设始终不会超过输入分辨率。 例如,如果输入为 720p,则输出将最高保持 720p。

ContentAwareEncoding

string

使用内容感知编码生成一组符合 GOP 标准的 MP4。 在提供任何输入内容的情况下,服务将对输入内容执行初始的轻量分析,并使用结果来确定最佳层数,以及自适应流式处理适合传送的比特率和分辨率设置。 此预设对于中低复杂度的视频特别有效,这些视频的输出文件的比特率将会较低,但质量仍可为观看者带来良好体验。 输出将包含带有交错式视频和音频的 MP4 文件。

ContentAwareEncodingExperimental

string

公开内容感知编码的实验预设。 在提供任何输入内容的情况下,服务将尝试自动确定最佳层数,以及自适应流式处理适合使用的比特率和分辨率设置。 底层算法将不断演进。 输出将包含带有交错式视频和音频的 MP4 文件。

CopyAllBitrateNonInterleaved

string

将输入资产中的所有视频和音频流复制为非交错视频和音频输出文件。 此预设可用于剪辑现有资产,或将一组关键帧 (GOP) 对齐的 MP4 文件转换为可流式传输的资产。

DDGoodQualityAudio

string

生成仅包含 DD (Digital Dolby) 以 192 kbps 编码的立体声音频的单个 MP4 文件。

H264MultipleBitrate1080p

string

生成一组 8 GOP 对齐的 MP4 文件(范围从 6000 kbps 到 400 kbps)和立体声 AAC 音频。 分辨率从 1080p 开始,下降到 180p。

H264MultipleBitrate720p

string

生成一组 6 GOP 对齐的 MP4 文件(范围从 3400 kbps 到 400 kbps)和立体声 AAC 音频。 分辨率从 720p 开始,下降到 180p。

H264MultipleBitrateSD

string

生成一组 5 GOP 对齐的 MP4 文件(范围从 1900kbps 到 400 kbps)和立体声 AAC 音频。 分辨率从 480p 开始,下降到 240p。

H264SingleBitrate1080p

string

生成 MP4 文件,其中视频以 6750 kbps 的 H.264 编解码器编码,图片高度为 1080 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。

H264SingleBitrate720p

string

生成 MP4 文件,其中视频以 4500 kbps 的 H.264 编解码器编码,图片高度为 720 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。

H264SingleBitrateSD

string

生成 MP4 文件,其中视频以 2200 kbps 的 H.264 编解码器编码,图片高度为 480 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。

H265AdaptiveStreaming

string

生成一组符合 GOP 的 MP4 文件,其中包含 H.265 视频和立体声 AAC 音频。 根据输入分辨率、比特率和帧速率自动生成比特率阶梯。 自动生成的预设始终不会超过输入分辨率。 例如,如果输入为 720p,则输出将最高保持 720p。

H265ContentAwareEncoding

string

使用内容感知编码生成一组符合 GOP 标准的 MP4。 在提供任何输入内容的情况下,服务将对输入内容执行初始的轻量分析,并使用结果来确定最佳层数,以及自适应流式处理适合传送的比特率和分辨率设置。 此预设对于中低复杂度的视频特别有效,这些视频的输出文件的比特率将会较低,但质量仍可为观看者带来良好体验。 输出将包含带有交错式视频和音频的 MP4 文件。

H265SingleBitrate1080p

string

生成 MP4 文件,其中视频以 3500 kbps 的 H.265 编解码器编码,图片高度为 1080 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。

H265SingleBitrate4K

string

生成 MP4 文件,其中视频以 9500 kbps 的 H.265 编解码器编码,图片高度为 2160 像素,立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。

H265SingleBitrate720p

string

生成 MP4 文件,其中视频以 1800 kbps 的 H.265 编解码器编码,图片高度为 720 像素,立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。

EntropyMode

要用于此层的熵模式。 如果未指定,编码器会选择适合配置文件和级别的模式。

名称 类型 说明
Cabac

string

上下文自适应二进制算术编码器 (CABAC) 熵编码。

Cavlc

string

上下文自适应可变长度编码器 (CAVLC) 熵编码。

ErrorAdditionalInfo

资源管理错误附加信息。

名称 类型 说明
info

object

其他信息。

type

string

其他信息类型。

ErrorDetail

错误详细信息。

名称 类型 说明
additionalInfo

ErrorAdditionalInfo[]

错误附加信息。

code

string

错误代码。

details

ErrorDetail[]

错误详细信息。

message

string

错误消息。

target

string

错误目标。

ErrorResponse

错误响应

名称 类型 说明
error

ErrorDetail

错误对象。

FaceDetectorPreset

描述分析视频时要使用的所有设置,以便检测 (并选择性地编辑) 存在的所有人脸。

名称 类型 说明
@odata.type string:

#Microsoft.Media.FaceDetectorPreset

派生类型的鉴别器。

blurType

BlurType

模糊类型

experimentalOptions

object

包含未在预设本身中公开的参数的键值对的字典

mode

FaceRedactorMode

此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件,该文件标记整个视频中人脸的外观。如果可能,为同一人的外观分配相同的 ID。2) 组合 - 此外, (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次通过过程,允许对检测到的人脸的子集进行选择性编辑。它从以前的分析阶段获取元数据文件,以及源视频,以及用户选择的需要修订的 ID 子集。

resolution

AnalysisResolution

指定分析视频时的最大分辨率。 默认行为为“SourceResolution”,它将在分析时将输入视频保持其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率更高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。 它还可以减少使用此组件的成本, (有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics) 。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。

FaceRedactorMode

此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件,该文件标记整个视频中人脸的外观。如果可能,为同一人的外观分配相同的 ID。2) 组合 - 此外, (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次通过过程,允许对检测到的人脸的子集进行选择性编辑。它从以前的分析阶段获取元数据文件,以及源视频,以及用户选择的需要修订的 ID 子集。

名称 类型 说明
Analyze

string

分析模式检测人脸并输出包含结果的元数据文件。 允许在人脸模糊之前使用“修订”模式编辑元数据文件。

Combined

string

不需要编辑已分析人脸时,组合模式在一次执行分析和修订步骤。

Redact

string

修订模式使用分析模式下的元数据文件,并编辑找到的人脸。

Fade

描述应用于输入媒体的淡化效果的属性。

名称 类型 说明
duration

string

视频中淡出效果的持续时间。 该值可以采用 ISO 8601 格式 (例如,PT05S 表示在) 5 秒内淡入/淡出颜色,或帧计数 (例如,10 表示从开始时间) 淡出 10 帧,或相对于流持续时间 (的相对值例如,10% 表示淡出 10% 的流持续时间)

fadeColor

string

淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上:例如:rgb (255,0,0) 、0xFF0000 或 #FF0000

start

string

输入视频中开始淡出的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 默认值为 0

Filters

描述在编码之前应用于输入媒体的所有筛选操作,例如去交错、旋转等。

名称 类型 说明
crop

Rectangle

用于裁剪输入视频的矩形窗口的参数。

deinterlace

Deinterlace

反交错设置。

fadeIn

Fade

描述应用于输入媒体的淡化效果的属性。

fadeOut

Fade

描述应用于输入媒体的淡化效果的属性。

overlays Overlay[]:

要应用于输入视频的覆盖的属性。 这些可以是音频、图像或视频覆盖。

rotation

Rotation

在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为 Auto

FromAllInputFile

一个 InputDefinition,用于查找提供的所有文件,以选择由 IncludedTracks 属性指定的曲目。 通常与 AudioTrackByAttribute 和 VideoTrackByAttribute 一起使用,以允许跨一组输入文件选择单个曲目。

名称 类型 说明
@odata.type string:

#Microsoft.Media.FromAllInputFile

派生类型的鉴别器。

includedTracks TrackDescriptor[]:

TrackDescriptors 列表,用于定义元数据和输入中的曲目选择。

FromEachInputFile

一个 InputDefinition,用于查看提供的每个输入文件,以选择由 IncludedTracks 属性指定的曲目。 通常与 AudioTrackByAttribute 和 VideoTrackByAttribute 一起使用,以便从给定的每个文件中选择曲目。

名称 类型 说明
@odata.type string:

#Microsoft.Media.FromEachInputFile

派生类型的鉴别器。

includedTracks TrackDescriptor[]:

TrackDescriptors 列表,用于定义元数据和输入中的曲目选择。

H264Complexity

告知编码器如何选择其编码设置。 默认值为“平衡”。

名称 类型 说明
Balanced

string

告知编码器使用在速度和质量之间实现平衡的设置。

Quality

string

告知编码器使用经过优化的设置,以生成更高质量的输出,但代价是总体编码时间变慢。

Speed

string

告知编码器使用经过优化以加快编码速度的设置。 为了缩短编码时间,会牺牲质量。

H264Layer

描述在使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

名称 类型 说明
adaptiveBFrame

boolean

编码此层时是否要使用自适应 B 帧。 如果未指定,则只要视频配置文件允许使用,编码器就会打开它。

bFrames

integer

编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。

bitrate

integer

生成此层时要对输入视频进行编码的平均比特率(以位/秒为单位)。 这是必填字段。

bufferWindow

string

VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应在 [0.1-100] 秒范围内。 默认值为 5 秒 (例如 PT5S) 。

crf

number

编码此层时要使用的 CRF 值。 此设置在 CRF 模式下设置视频编解码器的 RateControlMode 时生效。 CRF 值的范围在 0 到 51 之间,其中值越低,质量越好,代价是文件大小越大。 值越高意味着压缩程度越高,但在某些时候会注意到质量下降。 默认值为 23。

entropyMode

EntropyMode

要用于此层的熵模式。 如果未指定,编码器会选择适合配置文件和级别的模式。

frameRate

string

帧速率 (为此层编码) 每秒帧数。 该值可以是 M/N 的形式,其中 M 和 N 是整数 (例如,30000/1001) ,或者采用数字 (例如,30 或 29.97) 。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。

height

string

此层的输出视频的高度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的高度为输入的一半像素。

label

string

此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。

level

string

我们目前支持最高级别 6.2。 该值可以是 Auto,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,这允许编码器选择适合此层的级别。

maxBitrate

integer

最大比特率 (位/秒) ,此时应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。

profile

H264VideoProfile

我们目前支持基线、主、高、高、高422、高444。 默认值为“自动”。

referenceFrames

integer

编码此层时要使用的引用帧数。 如果未指定,编码器将根据编码器复杂性设置确定适当的数字。

slices

integer

编码此层时要使用的切片数。 如果未指定,默认值为零,这意味着编码器将为每个帧使用单个切片。

width

string

此层的输出视频的宽度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的像素宽度是输入的一半。

H264RateControlMode

视频速率控制模式

名称 类型 说明
ABR

string

命中目标比特率 (ABR) 模式的平均比特率:默认模式。

CBR

string

固定比特率 (CBR) 模式,该模式紧固目标比特率周围的比特率变化。

CRF

string

恒定速率因子 (以恒定主观质量为目标的 CRF) 模式。

H264Video

描述使用 H.264 编解码器对视频进行编码的所有属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.H264Video

派生类型的鉴别器。

complexity

H264Complexity

告知编码器如何选择其编码设置。 默认值为 Balanced。

keyFrameInterval

string

两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

layers

H264Layer[]

编码器要生成的输出 H.264 层的集合。

rateControlMode

H264RateControlMode

视频速率控制模式

sceneChangeDetection

boolean

编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

H264VideoProfile

我们目前支持基线、主、高、高、高422、高444。 默认值为“自动”。

名称 类型 说明
Auto

string

告知编码器自动确定相应的 H.264 配置文件。

Baseline

string

基线配置文件

High

string

高调。

High422

string

高 4:2:2 配置文件。

High444

string

高 4:4:4 预测配置文件。

Main

string

主配置文件

H265Complexity

告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快且更经济。 默认值为 Balanced。

名称 类型 说明
Balanced

string

告知编码器使用在速度和质量之间实现平衡的设置。

Quality

string

告知编码器使用经过优化的设置,以生成更高质量的输出,但代价是总体编码时间变慢。

Speed

string

告知编码器使用经过优化以加快编码速度的设置。 为了缩短编码时间,会牺牲质量。

H265Layer

介绍在使用 H.265 视频编解码器将输入视频编码为所需的输出比特率层时要使用的设置。

名称 类型 说明
adaptiveBFrame

boolean

指定编码此层时是否要使用自适应 B 帧。 如果未指定,则只要视频配置文件允许使用,编码器就会打开它。

bFrames

integer

编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。

bitrate

integer

生成此层时要对输入视频进行编码的平均比特率(以位/秒为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 意味着此值应为 3000000 这是必填字段。

bufferWindow

string

VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应在 [0.1-100] 秒范围内。 默认值为 5 秒 (例如 PT5S) 。

crf

number

编码此层时要使用的 CRF 值。 此设置在 CRF 模式下设置视频编解码器的 RateControlMode 时生效。 CRF 值的范围在 0 到 51 之间,其中值越低,质量越好,代价是文件大小越大。 值越高意味着压缩程度越高,但在某些时候会注意到质量下降。 默认值为 28。

frameRate

string

帧速率 (为此层编码) 每秒帧数。 该值可以是 M/N 的形式,其中 M 和 N 是整数 (例如,30000/1001) ,或者采用数字 (例如,30 或 29.97) 。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。

height

string

此层的输出视频的高度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的高度为输入的一半像素。

label

string

此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。

level

string

我们目前支持高达 6.2 的级别。 该值可以是 Auto,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,它允许编码器选择适合此层的级别。

maxBitrate

integer

最大比特率 (位/秒) ,此时应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。

profile

H265VideoProfile

我们目前支持 Main。 默认值为“自动”。

referenceFrames

integer

编码此层时要使用的引用帧数。 如果未指定,编码器将根据编码器复杂性设置确定适当的数字。

slices

integer

编码此层时要使用的切片数。 如果未指定,默认值为零,这意味着编码器将为每个帧使用单个切片。

width

string

此层的输出视频的宽度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的像素宽度是输入的一半。

H265Video

描述使用 H.265 编解码器对视频进行编码的所有属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.H265Video

派生类型的鉴别器。

complexity

H265Complexity

告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快且更经济。 默认值为 Balanced。

keyFrameInterval

string

两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

layers

H265Layer[]

编码器要生成的输出 H.265 层的集合。

sceneChangeDetection

boolean

指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

H265VideoProfile

我们目前支持 Main。 默认值为“自动”。

名称 类型 说明
Auto

string

告知编码器自动确定适当的 H.265 配置文件。

Main

string

主配置文件 (https://x265.readthedocs.io/en/default/cli.html?highlight=profile#profile-level-tier)

Main10

string

主 10 配置文件 (https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#Main_10)

Image

介绍用于从输入视频生成缩略图的基本属性

名称 类型 说明
@odata.type string:

#Microsoft.Media.Image

派生类型的鉴别器。

keyFrameInterval

string

两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

range

string

输入视频中相对于转换预设开始时间的位置,在该位置停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。

start

string

输入视频中开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。

step

string

生成缩略图的时间间隔。 值可以是 ISO 8601 格式 (例如,PT05S 表示每 5 秒) 一张图像,或者帧计数 (例如,每 30 帧) 一张图像 30,或流持续时间 (的相对值例如,每 10% 的流持续时间) 一个图像的 10%。 注意:步骤值将影响第一个生成的缩略图,该缩略图可能不完全是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试选择开始时间与开始时间的步长位置之间的最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流的持续时间较长,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预计接近开始时间,请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图,请将 Range 值设置为 1。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

ImageFormat

描述输出图像文件的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.ImageFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

InputFile

单个文件的 InputDefinition。 TrackSelections 的范围限定为指定的文件。

名称 类型 说明
@odata.type string:

#Microsoft.Media.InputFile

派生类型的鉴别器。

filename

string

此输入定义应用到的文件的名称。

includedTracks TrackDescriptor[]:

TrackDescriptors 列表,用于定义元数据和输入中的曲目选择。

InsightsType

定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅视频,则仅生成视频见解。 如果你希望某些输入仅使用视频,建议不要使用 AudioInsightsOnly;或者,如果你希望某些输入仅是音频,请使用 VideoInsightsOnly。 在这种情况下,作业将出错。

名称 类型 说明
AllInsights

string

生成音频和视频见解。 如果音频或视频见解失败,则失败。

AudioInsightsOnly

string

生成仅限音频的见解。 即使存在,也忽略视频。 如果没有音频,则失败。

VideoInsightsOnly

string

生成仅视频见解。 忽略音频(如果存在)。 如果没有视频,则失败。

InterleaveOutput

设置输出的交错模式,以控制以容器格式存储音频和视频的方式。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅限音频和仅视频的输出。

名称 类型 说明
InterleavedOutput

string

输出包括音频和视频。

NonInterleavedOutput

string

输出为仅视频或仅音频。

Job

作业资源类型。 可以通过轮询作业或使用 EventGrid 订阅事件来获取进度和状态。

名称 类型 说明
id

string

资源的完全限定的资源 ID。 例如 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

name

string

资源的名称

properties.correlationData

object

客户提供的键值对,将在作业和 JobOutput 状态事件中返回。

properties.created

string

客户创建作业的 UTC 日期和时间,采用“YYYY-MM-DDThh:mm:ssZ”格式。

properties.description

string

客户为作业提供的说明(可选)。

properties.endTime

string

此作业完成处理的 UTC 日期和时间。

properties.input JobInput:

作业的输入。

properties.lastModified

string

客户上次更新作业的 UTC 日期和时间,采用“YYYY-MM-DDThh:mm:ssZ”格式。

properties.outputs JobOutput[]:

JobOutputAsset[]

作业的输出。

properties.priority

Priority

处理作业的优先级。 较高优先级的作业在较低优先级的作业之前处理。 如果未设置,则默认为正常。

properties.startTime

string

此作业开始处理的 UTC 日期和时间。

properties.state

JobState

作业的当前状态。

systemData

systemData

与此资源相关的系统元数据。

type

string

资源类型。 例如“Microsoft.Compute/virtualMachines”或“Microsoft.Storage/storageAccounts”

JobError

JobOutput 错误的详细信息。

名称 类型 说明
category

JobErrorCategory

帮助对错误进行分类。

code

JobErrorCode

描述错误的错误代码。

details

JobErrorDetail[]

有关导致此项报告错误的特定错误的详细信息数组。

message

string

错误的可读语言相关表示形式。

retry

JobRetry

指示可以重试作业。 如果重试失败,请通过 Azure 门户联系 Azure 支持。

JobErrorCategory

帮助对错误进行分类。

名称 类型 说明
Account

string

此错误与帐户信息相关。

Configuration

string

错误与配置相关。

Content

string

此错误与输入文件中的数据相关。

Download

string

此错误与下载相关。

Service

string

此错误与服务相关。

Upload

string

错误与上传相关。

JobErrorCode

描述错误的错误代码。

名称 类型 说明
ConfigurationUnsupported

string

输入文件和应用的配置设置的组合出现问题,修复配置设置并使用相同的输入重试,或更改输入以匹配配置。

ContentMalformed

string

例如,输入内容 (出现问题:零字节文件或) 损坏/不可解码的文件,检查输入文件。

ContentUnsupported

string

输入 (无效媒体文件的格式出现问题,或者不支持的文件/编解码器) ,检查输入文件的有效性。

DownloadNotAccessible

string

尝试下载输入文件时,无法访问这些文件,请检查源的可用性。

DownloadTransientError

string

尝试下载输入文件时,传输 (存储服务时出现问题,) 出现网络错误,请参阅详细信息并检查源。

IdentityUnsupported

string

验证帐户标识时出错。 检查并修复标识配置,然后重试。 如果失败,请联系支持人员。

ServiceError

string

严重服务错误,请联系支持人员。

ServiceTransientError

string

暂时性错误,请重试;如果重试失败,请联系支持人员。

UploadNotAccessible

string

尝试上传输出文件时,无法访问目标,请检查目标的可用性。

UploadTransientError

string

尝试上传输出文件时,传输 (存储服务期间出现问题,网络错误) ,请参阅详细信息并检查目标。

JobErrorDetail

JobOutput 错误的详细信息。

名称 类型 说明
code

string

描述错误详细信息的代码。

message

string

错误的用户可读表示形式。

JobInputAsset

表示要输入到作业中的资产。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JobInputAsset

派生类型的鉴别器。

assetName

string

输入资产的名称。

end ClipTime:

定义输入媒体时间线上的一个点,处理将在该点结束。 默认为输入媒体的末尾。

files

string[]

文件列表。 JobInputHttp 必需。 每个最多 4000 个字符。 服务响应中不会返回查询字符串,以防止敏感数据泄露。

inputDefinitions InputDefinition[]:

定义 InputDefinitions 的列表。 对于每个 InputDefinition,它定义曲目选择和相关元数据的列表。

label

string

分配给 JobInputClip 的标签,用于满足转换中使用的引用。 例如,可以创作转换,以便获取标签为“xyz”的图像文件,并在编码之前将其作为覆盖应用于输入视频。 提交作业时,恰好其中一个 JobInputs 应为图像文件,并且其标签应为“xyz”。

start ClipTime:

定义输入媒体时间线上的一个点,处理将从该点开始。 默认为输入媒体的开头。

JobInputClip

表示作业的输入文件。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JobInputClip

派生类型的鉴别器。

end ClipTime:

定义输入媒体时间线上的一个点,处理将在该点结束。 默认为输入媒体的末尾。

files

string[]

文件列表。 JobInputHttp 必需。 每个最多 4000 个字符。 服务响应中不会返回查询字符串,以防止敏感数据泄露。

inputDefinitions InputDefinition[]:

定义 InputDefinitions 的列表。 对于每个 InputDefinition,它定义曲目选择和相关元数据的列表。

label

string

分配给 JobInputClip 的标签,用于满足转换中使用的引用。 例如,可以创作转换,以便获取标签为“xyz”的图像文件,并在编码之前将其作为覆盖应用于输入视频。 提交作业时,恰好其中一个 JobInputs 应为图像文件,并且其标签应为“xyz”。

start ClipTime:

定义输入媒体时间线上的一个点,处理将从该点开始。 默认为输入媒体的开头。

JobInputHttp

表示 HTTPS 作业输入。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JobInputHttp

派生类型的鉴别器。

baseUri

string

HTTPS 作业输入的基 URI。 它将与提供的文件名连接。 如果未提供基 URI,则假定提供的文件列表是完全限定的 URI。 最大长度为 4000 个字符。 查询字符串不会在服务响应中返回,以防止敏感数据泄露。

end ClipTime:

定义输入媒体时间线上的一个点,处理将在该点结束。 默认为输入媒体的末尾。

files

string[]

文件列表。 JobInputHttp 必需。 每个最多 4000 个字符。 服务响应中不会返回查询字符串,以防止敏感数据泄露。

inputDefinitions InputDefinition[]:

定义 InputDefinitions 的列表。 对于每个 InputDefinition,它定义曲目选择和相关元数据的列表。

label

string

分配给 JobInputClip 的标签,用于满足转换中使用的引用。 例如,可以创作转换,以便获取标签为“xyz”的图像文件,并在编码之前将其作为覆盖应用于输入视频。 提交作业时,恰好其中一个 JobInputs 应为图像文件,并且其标签应为“xyz”。

start ClipTime:

定义输入媒体时间线上的一个点,处理将从该点开始。 默认为输入媒体的开头。

JobInputs

描述作业的输入列表。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JobInputs

派生类型的鉴别器。

inputs JobInput[]:

作业的输入列表。

JobInputSequence

序列包含剪辑的有序列表,其中每个剪辑都是 JobInput。 序列将被视为单个输入。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JobInputSequence

派生类型的鉴别器。

inputs JobInputClip[]:

构成时间线的 JobInput。

JobOutputAsset

表示用作 JobOutput 的资产。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JobOutputAsset

派生类型的鉴别器。

assetName

string

输出资产的名称。

endTime

string

此作业输出完成处理的 UTC 日期和时间。

error

JobError

如果 JobOutput 处于“错误”状态,则包含错误的详细信息。

label

string

分配给 JobOutput 以帮助唯一标识它的标签。 当转换具有多个 TransformOutput(即作业具有多个 JobOutput)时,这非常有用。 在这种情况下,提交作业时,将添加两个或多个 JobOutput,顺序与转换中的 TransformOutputs 相同。 随后,通过事件或 GET 请求检索作业时,可以使用 标签轻松标识 JobOutput。 如果未提供标签,将使用默认值“{presetName}_{outputIndex}”,其中预设名称是相应 TransformOutput 中预设的名称,输出索引是作业中此 JobOutput 的相对索引。 请注意,此索引与其 Transform 中相应 TransformOutput 的相对索引相同。

presetOverride Preset:

用于替代相应转换输出中的预设的预设。

progress

integer

如果 JobOutput 处于“正在处理”状态,则包含作业完成百分比。 该值是估计值,不用于预测作业完成时间。 若要确定 JobOutput 是否已完成,请使用 State 属性。

startTime

string

此作业输出开始处理的 UTC 日期和时间。

state

JobState

描述 JobOutput 的状态。

JobRetry

指示可以重试作业。 如果重试失败,请通过 Azure 门户联系 Azure 支持。

名称 类型 说明
DoNotRetry

string

需要调查问题,然后重新提交作业并更正,或在基础问题得到更正后重试。

MayRetry

string

在等待一段时间并重新提交同一作业后,问题可能会得到解决。

JobState

描述 JobOutput 的状态。

名称 类型 说明
Canceled

string

已取消作业。 这是作业的最终状态。

Canceling

string

正在取消作业。 这是作业的暂时性状态。

Error

string

作业遇到错误。 这是作业的最终状态。

Finished

string

作业已完成。 这是作业的最终状态。

Processing

string

正在处理作业。 这是作业的暂时性状态。

Queued

string

作业处于排队状态,等待资源可用。 这是一个暂时性状态。

Scheduled

string

正在计划作业在可用资源上运行。 这是处于排队状态和正在处理状态之间的暂时性状态。

JpgFormat

描述用于生成 JPEG 缩略图的设置。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JpgFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

JpgImage

描述用于从输入视频生成一系列 JPEG 图像的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JpgImage

派生类型的鉴别器。

keyFrameInterval

string

两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

layers

JpgLayer[]

编码器要生成的输出 JPEG 图像层的集合。

range

string

输入视频中相对于转换预设开始时间的位置,在该位置停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。

spriteColumn

integer

设置缩略图子画面图像中使用的列数。 将自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超过 JPEG 最大像素分辨率限制 65535x65535。

start

string

输入视频中开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。

step

string

生成缩略图的时间间隔。 值可以是 ISO 8601 格式 (例如,PT05S 表示每 5 秒) 一张图像,或者帧计数 (例如,每 30 帧) 一张图像 30,或流持续时间 (的相对值例如,每 10% 的流持续时间) 一个图像的 10%。 注意:步骤值将影响第一个生成的缩略图,该缩略图可能不完全是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试选择开始时间与开始时间的步长位置之间的最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流的持续时间较长,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预计接近开始时间,请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图,请将 Range 值设置为 1。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

JpgLayer

描述从输入视频生成 JPEG 图像的设置。

名称 类型 说明
height

string

此层的输出视频的高度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的高度为输入的一半像素。

label

string

此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。

quality

integer

JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。

width

string

此层的输出视频的宽度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的像素宽度是输入的一半。

Mp4Format

描述输出 ISO MP4 文件的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.Mp4Format

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

outputFiles

OutputFile[]

要生成的输出文件的列表。 列表中的每个条目都是一组要复用在一起的音频和视频层标签。

MultiBitrateFormat

描述用于生成 GOP 对齐的多比特率文件集合的属性。 默认行为是为每个视频层生成一个输出文件,该文件与所有音频一起复用。 可以通过指定 outputFiles 集合来控制生成的确切输出文件。

名称 类型 说明
@odata.type string:

#Microsoft.Media.MultiBitrateFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

outputFiles

OutputFile[]

要生成的输出文件的列表。 列表中的每个条目都是一组要复用在一起的音频和视频层标签。

OutputFile

表示生成的输出文件。

名称 类型 说明
labels

string[]

描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成两个带有 v1 和 v2 标签的视频层,以及一个带有标签 a1 的视频层,则类似“[v1, a1]”的数组会告知编码器生成一个输出文件,其中包含 v1 表示的视频轨迹和由 a1 表示的音频轨道。

PngFormat

描述用于生成 PNG 缩略图的设置。

名称 类型 说明
@odata.type string:

#Microsoft.Media.PngFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

PngImage

描述用于从输入视频生成一系列 PNG 图像的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.PngImage

派生类型的鉴别器。

keyFrameInterval

string

两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

layers

PngLayer[]

要由编码器生成的输出 PNG 图像层的集合。

range

string

输入视频中相对于转换预设开始时间的位置,在该位置停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。

start

string

输入视频中开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。

step

string

生成缩略图的时间间隔。 值可以是 ISO 8601 格式 (例如,PT05S 表示每 5 秒) 一张图像,或者帧计数 (例如,每 30 帧) 一张图像 30,或流持续时间 (的相对值例如,每 10% 的流持续时间) 一个图像的 10%。 注意:步骤值将影响第一个生成的缩略图,该缩略图可能不完全是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试选择开始时间与开始时间的步长位置之间的最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流的持续时间较长,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预计接近开始时间,请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图,请将 Range 值设置为 1。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

PngLayer

描述从输入视频生成 PNG 图像的设置。

名称 类型 说明
height

string

此层的输出视频的高度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的高度为输入的一半像素。

label

string

此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。

width

string

此层的输出视频的宽度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的像素宽度是输入的一半。

PresetConfigurations

编码器的可选配置设置的对象。

名称 类型 说明
complexity

Complexity

可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将“复杂性”设置为“速度”,以加快编码速度,但降低压缩效率。

interleaveOutput

InterleaveOutput

设置输出的交错模式,以控制音频和视频以容器格式存储的方式。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。

keyFrameIntervalInSeconds

number

关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。

maxBitrateBps

integer

最高视频层) (阈值的最大比特率(以位/秒为单位)。 示例:将 MaxBitrateBps 设置为 6000000,以避免为高复杂度的内容生成非常高的比特率输出。

maxHeight

integer

输出视频层的最大高度。 示例:将 MaxHeight 设置为 720 以生成高达 720P 的输出层,即使输入为 4K 也是如此。

maxLayers

integer

输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,以确保最多生成 4 个输出层,以控制编码作业的总体成本。

minBitrateBps

integer

底部视频层) 的最小比特率 (阈值(以比特/秒为单位)。 示例:将 MinBitrateBps 设置为 200000,以创建一个覆盖低网络带宽用户的底层。

minHeight

integer

输出视频层的最小高度。 示例:将 MinHeight 设置为 360 以避免输出层的较小分辨率(如 180P)。

Priority

设置转换中 TransformOutputs 的相对优先级。 这将设置服务用于处理 TransformOutput 的优先级。 默认优先级为 Normal。

名称 类型 说明
High

string

用于应优先于其他转换输出。

Low

string

用于可在正常和高优先级 TransformOutputs 之后生成的 TransformOutput。

Normal

string

用于可在普通优先级下生成的 TransformOutput。

Rectangle

描述在处理输入媒体之前应用于输入媒体的矩形窗口的属性。

名称 类型 说明
height

string

矩形区域的高度(以像素为单位)。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。

left

string

左边距的像素数。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。

top

string

上边距的像素数。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。

width

string

矩形区域的宽度(以像素为单位)。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。

Rotation

在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为 Auto

名称 类型 说明
Auto

string

根据需要自动检测和旋转。

None

string

不要旋转视频。 如果输出格式支持,则有关旋转的任何元数据将保持不变。

Rotate0

string

不要旋转视频,但删除有关旋转的任何元数据。

Rotate180

string

顺时针旋转 180 度。

Rotate270

string

顺时针旋转 270 度。

Rotate90

string

顺时针旋转 90 度。

SelectAudioTrackByAttribute

通过指定属性和属性筛选器,从输入中选择音轨。

名称 类型 说明
@odata.type string:

#Microsoft.Media.SelectAudioTrackByAttribute

派生类型的鉴别器。

attribute

TrackAttribute

用于筛选跟踪的 TrackAttribute。

channelMapping

ChannelMapping

单声道音轨的可选指定。 可用于将音轨合并成立体声或多声道音频轨。

filter

AttributeFilter

要应用于 TrackAttribute 以便选择轨的 AttributeFilter 的类型。

filterValue

string

要按其筛选跟踪的值。 仅在为 Filter 属性指定 AttributeFilter.ValueEquals 时使用。

SelectAudioTrackById

通过指定音轨标识符从输入中选择音轨。

名称 类型 说明
@odata.type string:

#Microsoft.Media.SelectAudioTrackById

派生类型的鉴别器。

channelMapping

ChannelMapping

单声道音轨的可选指定。 可用于将音轨合并成立体声或多声道音频轨。

trackId

integer

要选择的跟踪标识符

SelectVideoTrackByAttribute

通过指定属性和属性筛选器,从输入中选择视频轨道。

名称 类型 说明
@odata.type string:

#Microsoft.Media.SelectVideoTrackByAttribute

派生类型的鉴别器。

attribute

TrackAttribute

用于筛选跟踪的 TrackAttribute。

filter

AttributeFilter

要应用于 TrackAttribute 以便选择轨的 AttributeFilter 的类型。

filterValue

string

要按其筛选跟踪的值。 仅在为 Filter 属性指定 AttributeFilter.ValueEquals 时使用。 对于 TrackAttribute.Bitrate,这应该是 (位/秒的整数值,例如:“1500000”) 。 视频曲目不支持 TrackAttribute.Language。

SelectVideoTrackById

通过指定曲目标识符从输入中选择视频轨道。

名称 类型 说明
@odata.type string:

#Microsoft.Media.SelectVideoTrackById

派生类型的鉴别器。

trackId

integer

要选择的跟踪标识符

StandardEncoderPreset

介绍使用标准编码器对输入视频进行编码时要使用的所有设置。

名称 类型 说明
@odata.type string:

#Microsoft.Media.StandardEncoderPreset

派生类型的鉴别器。

codecs Codec[]:

编码输入视频时要使用的编解码器列表。

experimentalOptions

object

包含未在预设本身中公开的参数的键值对的字典

filters

Filters

编码前应用于输入媒体的一个或多个筛选操作。

formats Format[]:

编码器要生成的输出列表。

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

名称 类型 说明
AutoFit

string

在输出 (上填充写字框或柱框) 以遵循输出分辨率,同时确保输出中的活动视频区域具有与输入相同的纵横比。 例如,如果输入为 1920x1080,编码预设要求为 1280x1280,则输出将为 1280x1280,其中包含一个纵横比为 16:9 的 1280x720 的内部矩形,以及左右两侧宽为 280 像素的柱形框区域。

AutoSize

string

替代输出分辨率,并更改它以匹配输入的显示纵横比,而无需填充。 例如,如果输入为 1920x1080,而编码预设要求提供 1280x1280,则会重写预设中的值,输出将是 1280x720,这样可以保持 16:9 的输入纵横比。

None

string

严格遵循输出分辨率,而不考虑输入视频的像素纵横比或显示纵横比。

systemData

与资源的创建和上次修改相关的元数据。

名称 类型 说明
createdAt

string

资源创建时间戳 (UTC) 。

createdBy

string

创建资源的标识。

createdByType

createdByType

创建资源的标识类型。

lastModifiedAt

string

资源上次修改的时间戳 (UTC)

lastModifiedBy

string

上次修改资源的标识。

lastModifiedByType

createdByType

上次修改资源的标识类型。

TrackAttribute

用于筛选跟踪的 TrackAttribute。

名称 类型 说明
Bitrate

string

轨道的比特率。

Language

string

曲目的语言。

TransportStreamFormat

介绍用于生成 MPEG-2 传输流 (ISO/IEC 13818-1) 输出视频文件 () 的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.TransportStreamFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

outputFiles

OutputFile[]

要生成的输出文件的列表。 列表中的每个条目都是一组要复用在一起的音频和视频层标签。

UtcClipTime

将剪辑时间指定为媒体文件中的 Utc 时间位置。 Utc 时间可以指向不同的位置,具体取决于媒体文件是否从时间戳零开始。

名称 类型 说明
@odata.type string:

#Microsoft.Media.UtcClipTime

派生类型的鉴别器。

time

string

基于 Utc 时间的输入媒体时间线上的时间位置。

Video

介绍用于编码输入视频的基本属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.Video

派生类型的鉴别器。

keyFrameInterval

string

两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

VideoAnalyzerPreset

视频分析器预设,用于从音频和视频提取见解 (丰富的元数据) ,并输出 JSON 格式化文件。

名称 类型 说明
@odata.type string:

#Microsoft.Media.VideoAnalyzerPreset

派生类型的鉴别器。

audioLanguage

string

使用“语言标记区域”的 BCP-47 格式的输入中的音频有效负载的语言 (例如:“en-US”) 。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为自动语言检测不包括在基本模式下。 如果未指定语言或将语言设置为 null,自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。 它目前不支持在检测到第一种语言后在各语言之间进行动态切换。 自动检测最适用于具有清晰可辨识语音的录音。 如果自动检测找不到语言,听录将回退到'en-US'。此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463

experimentalOptions

object

包含未在预设本身中公开的参数的键值对的字典

insightsToExtract

InsightsType

定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅视频,则仅生成视频见解。 如果你希望某些输入仅为视频,建议不要使用 AudioInsightsOnly;如果希望某些输入仅为音频,请使用 VideoInsightsOnly。 在这种情况下,作业将出错。

mode

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。

VideoOverlay

描述视频覆盖的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.VideoOverlay

派生类型的鉴别器。

audioGainLevel

number

覆盖中音频的增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。

cropRectangle

Rectangle

用于裁剪覆盖图像或视频的可选矩形窗口。

end

string

结束位置,以及对输入视频的引用,覆盖的结束位置。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频的 30 秒处结束覆盖。 如果未指定或值大于输入视频持续时间,则覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。

fadeInDuration

string

覆盖淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是无淡入 (与 PT0S) 相同。

fadeOutDuration

string

覆盖淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是没有淡出 (与 PT0S) 相同。

inputLabel

string

要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件,或者指定音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件。 有关支持的音频和视频文件格式的完整列表,请参阅 https://aka.ms/mesformats

opacity

number

覆盖层的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,这意味着覆盖不透明。

position

Rectangle

输入视频中应用覆盖的位置。

start

string

开始位置,以及对输入视频的引用,覆盖层从该位置开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频的 5 秒处开始覆盖。 如果未指定,则覆盖层从输入视频的开头开始。

VideoSyncMode

视频同步模式

名称 类型 说明
Auto

string

这是默认方法。 根据复用器功能在 Cfr 和 Vfr 之间进行选择。 对于输出格式 MP4,默认模式为 Cfr。

Cfr

string

将根据需要重复和/或删除输入帧,以完全达到请求的恒定帧速率。 当输出帧速率显式设置为指定值时,建议使用

Passthrough

string

帧上的呈现时间戳从输入文件传递到输出文件编写器。 当输入源具有可变的帧速率,并且尝试在输出中生成多个用于自适应流式处理(具有对齐 GOP 边界)的层时,建议使用。 注意:如果输入中的两个或更多帧具有重复的时间戳,则输出也将具有相同的行为

Vfr

string

类似于传递模式,但如果输入具有重复时间戳的帧,则只有一个帧传递到输出,而其他帧则被删除。 当输出帧数应等于输入帧数时,建议使用。 例如,输出用于根据输入计算 PSNR 等质量指标

VideoTrackDescriptor

用于选择视频轨道的 TrackSelection。

名称 类型 说明
@odata.type string:

#Microsoft.Media.VideoTrackDescriptor

派生类型的鉴别器。