你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Transforms - Update
更新转换
汇报转换。
PATCH https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Media/mediaServices/{accountName}/transforms/{transformName}?api-version=2022-07-01
URI 参数
名称 | 在 | 必需 | 类型 | 说明 |
---|---|---|---|---|
account
|
path | True |
string |
媒体服务帐户名称。 |
resource
|
path | True |
string |
Azure 订阅中资源组的名称。 |
subscription
|
path | True |
string |
Microsoft Azure 订阅的唯一标识符。 |
transform
|
path | True |
string |
转换名称。 |
api-version
|
query | True |
string |
要与客户端请求一起使用的 API 的版本。 |
请求正文
名称 | 必需 | 类型 | 说明 |
---|---|---|---|
properties.outputs | True |
转换应该生成的一个或多个 TransformOutput 的数组。 |
|
properties.description |
string |
转换的可选详细说明。 |
响应
名称 | 类型 | 说明 |
---|---|---|
200 OK |
确定 |
|
Other Status Codes |
详细的错误信息。 |
示例
Update a Transform.
示例请求
PATCH https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaServices/contosomedia/transforms/transformToUpdate?api-version=2022-07-01
{
"properties": {
"description": "Example transform to illustrate update.",
"outputs": [
{
"relativePriority": "High",
"preset": {
"@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
"presetName": "H264MultipleBitrate720p"
}
}
]
}
}
示例响应
{
"name": "transformToUpdate",
"id": "/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/transformToUpdate",
"type": "Microsoft.Media/mediaservices/transforms",
"properties": {
"created": "2022-10-17T23:14:32.1435128Z",
"description": "Example transform to illustrate update.",
"lastModified": "2022-10-17T23:14:32.1455494Z",
"outputs": [
{
"onError": "StopProcessingJob",
"relativePriority": "High",
"preset": {
"@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
"presetName": "H264MultipleBitrate720p"
}
}
]
},
"systemData": {
"createdBy": "contoso@microsoft.com",
"createdByType": "User",
"createdAt": "2022-10-17T23:14:32.1435128Z",
"lastModifiedBy": "contoso@microsoft.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2022-10-17T23:14:32.1455494Z"
}
}
定义
名称 | 说明 |
---|---|
Aac |
介绍高级音频编解码器 (AAC) 音频编码设置。 |
Aac |
使用 AAC 编码音频时要使用的编码配置文件。 |
Analysis |
指定分析视频时的最大分辨率。 默认行为为“SourceResolution”,它将在分析时将输入视频保持其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频的分辨率更高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。 它还可以减少使用此组件的成本, (有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics) 。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。 |
Audio |
定义所有音频编解码器的通用属性。 |
Audio |
确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。 |
Audio |
音频分析器预设应用一组预定义的基于 AI 的分析操作,包括语音听录。 目前,该预设支持处理单个音轨的内容。 |
Audio |
描述音频覆盖的属性。 |
Blur |
模糊类型 |
Built |
介绍使用标准编码器对输入视频进行编码的内置预设。 |
Complexity |
可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将“复杂性”设置为“速度”,以加快编码速度,但降低压缩效率。 |
Copy |
一个编解码器标志,指示编码器复制输入音频比特流。 |
Copy |
一个编解码器标志,指示编码器在不重新编码的情况下复制输入视频比特流。 |
created |
创建资源的标识类型。 |
DDAudio |
介绍杜比数字音频编解码器 (AC3) 音频编码设置。 Dolby Digital Audio 支持的当前实现是:1 ( (单声道) 、2 (立体声) 、6 (5.1 边) ;音频采样频率速率:32K/44.1K/48K Hz;AC3 规范支持的音频比特率值:32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。 |
Deinterlace |
描述反交错设置。 |
Deinterlace |
去隔行模式。 默认为 AutoPixelAdaptive。 |
Deinterlace |
反交错的字段奇偶校验,默认为“自动”。 |
Encoder |
用于编码视频的内置预设。 |
Entropy |
要用于此层的熵模式。 如果未指定,编码器将选择适合配置文件和级别的模式。 |
Error |
资源管理错误附加信息。 |
Error |
错误详细信息。 |
Error |
错误响应 |
Face |
描述分析视频时要使用的所有设置,以便检测 (并选择性地编辑) 存在的所有人脸。 |
Face |
此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件,该文件标记整个视频中人脸的外观。如果可能,为同一人的外观分配相同的 ID。2) 组合 - 此外, (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次通过过程,允许对检测到的人脸的子集进行选择性编辑。它从以前的分析阶段获取元数据文件,以及源视频,以及用户选择的需要修订的 ID 子集。 |
Fade |
描述应用于输入媒体的淡化效果的属性。 |
Filters |
描述编码前要应用于输入媒体的所有筛选操作,例如去隔行扫描、旋转等。 |
H264Complexity |
告知编码器如何选择其编码设置。 默认值为“平衡”。 |
H264Layer |
描述在使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。 |
H264Rate |
视频速率控制模式 |
H264Video |
介绍使用 H.264 编解码器对视频进行编码的所有属性。 |
H264Video |
我们目前支持 Baseline、Main、High、High422、High444。 默认值为“自动”。 |
H265Complexity |
告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快、更经济。 默认值为“平衡”。 |
H265Layer |
描述在使用 H.265 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。 |
H265Video |
描述使用 H.265 编解码器对视频进行编码的所有属性。 |
H265Video |
我们目前支持 Main。 默认值为“自动”。 |
Image |
介绍用于从输入视频生成缩略图的基本属性 |
Image |
描述输出图像文件的属性。 |
Insights |
定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅视频,则仅生成视频见解。 如果你希望某些输入仅使用视频,建议不要使用 AudioInsightsOnly;或者,如果你希望某些输入仅是音频,请使用 VideoInsightsOnly。 在这种情况下,作业将出错。 |
Interleave |
设置输出的交错模式,以控制以容器格式存储音频和视频的方式。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅限音频和仅视频的输出。 |
Jpg |
描述用于生成 JPEG 缩略图的设置。 |
Jpg |
介绍用于从输入视频生成一系列 JPEG 图像的属性。 |
Jpg |
描述从输入视频生成 JPEG 图像的设置。 |
Mp4Format |
描述输出 ISO MP4 文件的属性。 |
Multi |
描述用于生成 GOP 对齐的多比特率文件集合的属性。 默认行为是为每个视频层生成一个输出文件,该文件与所有音频一起复用。 可以通过指定 outputFiles 集合来控制生成的确切输出文件。 |
On |
转换可以定义多个输出。 此属性定义当一个输出失败时服务应执行的操作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。 |
Output |
表示生成的输出文件。 |
Png |
描述用于生成 PNG 缩略图的设置。 |
Png |
介绍用于从输入视频生成一系列 PNG 图像的属性。 |
Png |
描述从输入视频生成 PNG 图像的设置。 |
Preset |
编码器的可选配置设置的对象。 |
Priority |
设置转换中 TransformOutputs 的相对优先级。 这将设置服务用于处理 TransformOutput 的优先级。 默认优先级为 Normal。 |
Rectangle |
描述在处理输入媒体之前应用于输入媒体的矩形窗口的属性。 |
Rotation |
在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为 Auto |
Standard |
介绍在使用标准编码器对输入视频进行编码时要使用的所有设置。 |
Stretch |
调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize |
system |
与资源的创建和上次修改相关的元数据。 |
Transform |
转换封装用于从输入媒体生成所需输出的规则或指令,例如通过转码或提取见解。 创建转换后,可以通过创建作业将其应用于输入媒体。 |
Transform |
描述 TransformOutput 的属性,这些属性是在生成所需输出时要应用的规则。 |
Transport |
介绍用于生成 MPEG-2 传输流 (ISO/IEC 13818-1) 输出视频文件 () 的属性。 |
Video |
介绍用于编码输入视频的基本属性。 |
Video |
视频分析器预设,用于从音频和视频中提取见解 (丰富的元数据) ,并输出 JSON 格式化文件。 |
Video |
描述视频覆盖的属性。 |
Video |
视频同步模式 |
AacAudio
介绍高级音频编解码器 (AAC) 音频编码设置。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
bitrate |
integer |
输出编码音频的比特率(以比特/秒为单位)。 |
channels |
integer |
音频中的通道数。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
profile |
使用 AAC 对音频进行编码时要使用的编码配置文件。 |
|
samplingRate |
integer |
用于编码的采样率(以赫茨为单位)。 |
AacAudioProfile
使用 AAC 编码音频时要使用的编码配置文件。
名称 | 类型 | 说明 |
---|---|---|
AacLc |
string |
指定将输出音频编码为 AAC 低复杂度配置文件 (AAC-LC) 。 |
HeAacV1 |
string |
指定输出音频将编码为 HE-AAC v1 配置文件。 |
HeAacV2 |
string |
指定输出音频将编码为 HE-AAC v2 配置文件。 |
AnalysisResolution
指定分析视频时的最大分辨率。 默认行为为“SourceResolution”,它将在分析时将输入视频保持其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频的分辨率更高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。 它还可以减少使用此组件的成本, (有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics) 。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。
名称 | 类型 | 说明 |
---|---|---|
SourceResolution |
string |
|
StandardDefinition |
string |
Audio
定义所有音频编解码器的通用属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
bitrate |
integer |
输出编码音频的比特率(以位/秒为单位)。 |
channels |
integer |
音频中的声道数。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
samplingRate |
integer |
用于以赫为单位编码的采样率。 |
AudioAnalysisMode
确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。
名称 | 类型 | 说明 |
---|---|---|
Basic |
string |
此模式执行语音转文本听录并生成 VTT 字幕文件。 此模式的输出包括一个见解 JSON 文件,该文件仅包含关键字、听录和计时信息。 此模式不包括自动语言检测和说话人分割聚类。 |
Standard |
string |
执行基本模式中包含的所有操作,此外还执行语言检测和说话人分割。 |
AudioAnalyzerPreset
音频分析器预设应用一组预定义的基于 AI 的分析操作,包括语音听录。 目前,该预设支持处理单个音轨的内容。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
audioLanguage |
string |
使用“语言标记区域”的 BCP-47 格式的输入中的音频有效负载的语言 (例如:“en-US”) 。 如果你知道内容的语言,建议你指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为自动语言检测不包括在基本模式下。 如果未指定语言或将语言设置为 null,自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。 它目前不支持在检测到第一种语言后在各语言之间进行动态切换。 自动检测最适用于具有清晰可辨识语音的录音。 如果自动检测找不到该语言,则听录将回退到'en-US'。”此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463 |
experimentalOptions |
object |
包含未在预设本身中公开的参数的键值对的字典 |
mode |
确定要执行的音频分析操作集。 如果未指定,将选择标准 AudioAnalysisMode。 |
AudioOverlay
描述音频覆盖的属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
audioGainLevel |
number |
覆盖中音频的增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。 |
end |
string |
结束位置(引用了覆盖结束处的输入视频)。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频的 30 秒处结束覆盖。 如果未指定或该值大于输入视频持续时间,则覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。 |
fadeInDuration |
string |
覆盖淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是无淡入 (与 PT0S) 相同。 |
fadeOutDuration |
string |
覆盖淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是没有淡出 (与 PT0S) 相同。 |
inputLabel |
string |
要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件,或者指定音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件。 有关支持的音频和视频文件格式的完整列表,请参阅 https://aka.ms/mesformats 。 |
start |
string |
开始位置(引用了覆盖层开始的输入视频)。 该值应采用 ISO 8601 格式。 例如,PT05S 在 5 秒处开始覆盖输入视频。 如果未指定,覆盖层将从输入视频的开头开始。 |
BlurType
模糊类型
名称 | 类型 | 说明 |
---|---|---|
Black |
string |
黑色:遮光筛选器 |
Box |
string |
Box:调试筛选器,仅边界框 |
High |
string |
高:混淆模糊筛选器 |
Low |
string |
低:盒车模糊滤镜 |
Med |
string |
Med:高斯模糊筛选器 |
BuiltInStandardEncoderPreset
介绍使用标准编码器对输入视频进行编码的内置预设。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
configurations |
编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。 |
|
presetName |
用于编码视频的内置预设。 |
Complexity
可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将“复杂性”设置为“速度”,以加快编码速度,但降低压缩效率。
名称 | 类型 | 说明 |
---|---|---|
Balanced |
string |
将编码器配置为使用在速度和质量之间实现平衡的设置。 |
Quality |
string |
将编码器配置为使用经过优化的设置,以生成更高质量的输出,但代价是总体编码时间变慢。 |
Speed |
string |
将编码器配置为使用为加快编码速度而优化的设置。 为了缩短编码时间,会牺牲质量。 |
CopyAudio
一个编解码器标志,指示编码器复制输入音频比特流。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
CopyVideo
一个编解码器标志,指示编码器在不重新编码的情况下复制输入视频比特流。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
createdByType
创建资源的标识类型。
名称 | 类型 | 说明 |
---|---|---|
Application |
string |
|
Key |
string |
|
ManagedIdentity |
string |
|
User |
string |
DDAudio
介绍杜比数字音频编解码器 (AC3) 音频编码设置。 Dolby Digital Audio 支持的当前实现是:1 ( (单声道) 、2 (立体声) 、6 (5.1 边) ;音频采样频率速率:32K/44.1K/48K Hz;AC3 规范支持的音频比特率值:32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
bitrate |
integer |
输出编码音频的比特率(以位/秒为单位)。 |
channels |
integer |
音频中的声道数。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
samplingRate |
integer |
用于以赫为单位编码的采样率。 |
Deinterlace
描述反交错设置。
名称 | 类型 | 说明 |
---|---|---|
mode |
去交错模式。 默认为 AutoPixelAdaptive。 |
|
parity |
用于去交错的字段奇偶校验,默认为“自动”。 |
DeinterlaceMode
去隔行模式。 默认为 AutoPixelAdaptive。
名称 | 类型 | 说明 |
---|---|---|
AutoPixelAdaptive |
string |
对输入视频中的每个帧应用自动像素自适应反交错。 |
Off |
string |
禁用源视频的反交错。 |
DeinterlaceParity
反交错的字段奇偶校验,默认为“自动”。
名称 | 类型 | 说明 |
---|---|---|
Auto |
string |
自动检测字段的顺序 |
BottomFieldFirst |
string |
应用底部字段第一个处理输入视频。 |
TopFieldFirst |
string |
应用顶部字段第一处理输入视频。 |
EncoderNamedPreset
用于编码视频的内置预设。
名称 | 类型 | 说明 |
---|---|---|
AACGoodQualityAudio |
string |
生成单个 MP4 文件,该文件仅包含以 192 kbps 编码的 AAC 立体声音频。 |
AdaptiveStreaming |
string |
使用 H.264 视频和立体声 AAC 音频生成一组 GOP 对齐的 MP4 文件。 根据输入分辨率、比特率和帧速率自动生成比特率阶梯。 自动生成的预设始终不会超过输入分辨率。 例如,如果输入为 720p,则输出将最高保持 720p。 |
ContentAwareEncoding |
string |
使用内容感知编码生成一组符合 GOP 标准的 MP4。 在提供任何输入内容的情况下,服务将对输入内容执行初始的轻量分析,并使用结果来确定最佳层数,以及自适应流式处理适合传送的比特率和分辨率设置。 此预设对于中低复杂度的视频特别有效,这些视频的输出文件的比特率将会较低,但质量仍可为观看者带来良好体验。 输出将包含带有交错式视频和音频的 MP4 文件。 |
ContentAwareEncodingExperimental |
string |
公开内容感知编码的实验预设。 在提供任何输入内容的情况下,服务将尝试自动确定最佳层数,以及自适应流式处理适合使用的比特率和分辨率设置。 底层算法将不断演进。 输出将包含带有交错式视频和音频的 MP4 文件。 |
CopyAllBitrateNonInterleaved |
string |
将输入资产中的所有视频和音频流复制为非交错视频和音频输出文件。 此预设可用于剪辑现有资产,或将一组关键帧 (GOP) 对齐的 MP4 文件转换为可流式传输的资产。 |
DDGoodQualityAudio |
string |
生成单个 MP4 文件,其中仅包含 DD (Digital Dolby) 立体声音频,编码为 192 kbps。 |
H264MultipleBitrate1080p |
string |
生成一组 8 GOP 对齐的 MP4 文件,范围从 6000 kbps 到 400 kbps,以及立体声 AAC 音频。 分辨率从 1080p 开始,并下降到 180p。 |
H264MultipleBitrate720p |
string |
生成一组 6 GOP 对齐的 MP4 文件,范围从 3400 kbps 到 400 kbps,以及立体声 AAC 音频。 分辨率从 720p 开始,下降到 180p。 |
H264MultipleBitrateSD |
string |
生成一组 5 GOP 对齐的 MP4 文件,范围从 1900 kbps 到 400 kbps,以及立体声 AAC 音频。 分辨率从 480p 开始,下降到 240p。 |
H264SingleBitrate1080p |
string |
生成 MP4 文件,其中视频以 6750 kbps 的 H.264 编解码器编码,图片高度为 1080 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。 |
H264SingleBitrate720p |
string |
生成 MP4 文件,其中视频以 4500 kbps 的 H.264 编解码器编码,图片高度为 720 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。 |
H264SingleBitrateSD |
string |
生成 MP4 文件,其中视频以 2200 kbps 的 H.264 编解码器编码,图片高度为 480 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。 |
H265AdaptiveStreaming |
string |
生成一组符合 GOP 的 MP4 文件,其中包含 H.265 视频和立体声 AAC 音频。 根据输入分辨率、比特率和帧速率自动生成比特率阶梯。 自动生成的预设始终不会超过输入分辨率。 例如,如果输入为 720p,则输出将最高保持 720p。 |
H265ContentAwareEncoding |
string |
使用内容感知编码生成一组符合 GOP 标准的 MP4。 在提供任何输入内容的情况下,服务将对输入内容执行初始的轻量分析,并使用结果来确定最佳层数,以及自适应流式处理适合传送的比特率和分辨率设置。 此预设对于中低复杂度的视频特别有效,这些视频的输出文件的比特率将会较低,但质量仍可为观看者带来良好体验。 输出将包含带有交错式视频和音频的 MP4 文件。 |
H265SingleBitrate1080p |
string |
生成 MP4 文件,其中视频以 3500 kbps 的 H.265 编解码器编码,图片高度为 1080 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。 |
H265SingleBitrate4K |
string |
生成 MP4 文件,其中视频以 9500 kbps 的 H.265 编解码器编码,图片高度为 2160 像素,立体声音频使用 AAC-LC 编解码器以 128 kbps 进行编码。 |
H265SingleBitrate720p |
string |
生成一个 MP4 文件,其中视频使用 H.265 编解码器以 1800 kbps 编码,图片高度为 720 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。 |
EntropyMode
要用于此层的熵模式。 如果未指定,编码器将选择适合配置文件和级别的模式。
名称 | 类型 | 说明 |
---|---|---|
Cabac |
string |
上下文自适应二进制算术编码器 (CABAC) 熵编码。 |
Cavlc |
string |
上下文自适应可变长度编码器 (CAVLC) 熵编码。 |
ErrorAdditionalInfo
资源管理错误附加信息。
名称 | 类型 | 说明 |
---|---|---|
info |
object |
其他信息。 |
type |
string |
其他信息类型。 |
ErrorDetail
错误详细信息。
名称 | 类型 | 说明 |
---|---|---|
additionalInfo |
错误附加信息。 |
|
code |
string |
错误代码。 |
details |
错误详细信息。 |
|
message |
string |
错误消息。 |
target |
string |
错误目标。 |
ErrorResponse
错误响应
名称 | 类型 | 说明 |
---|---|---|
error |
错误对象。 |
FaceDetectorPreset
描述分析视频时要使用的所有设置,以便检测 (并选择性地编辑) 存在的所有人脸。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
blurType |
模糊类型 |
|
experimentalOptions |
object |
包含未在预设本身中公开的参数的键值对的字典 |
mode |
此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,为同一人的外观分配相同的 ID。2) 合并 - 此外, (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次传递过程,允许对检测到的一部分人脸进行选择性编辑。它从以前的分析阶段获取元数据文件,以及源视频,以及用户选择的需要编修的 ID 子集。 |
|
resolution |
指定分析视频时的最大分辨率。 默认行为为“SourceResolution”,它将在分析时将输入视频保持其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率更高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。 它还可以降低使用此组件的成本, (https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics 有关详细信息) 。 但是,可能无法检测到在调整大小后的视频中最终太小的人脸。 |
FaceRedactorMode
此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件,该文件标记整个视频中人脸的外观。如果可能,为同一人的外观分配相同的 ID。2) 组合 - 此外, (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次通过过程,允许对检测到的人脸的子集进行选择性编辑。它从以前的分析阶段获取元数据文件,以及源视频,以及用户选择的需要修订的 ID 子集。
名称 | 类型 | 说明 |
---|---|---|
Analyze |
string |
分析模式检测人脸并输出包含结果的元数据文件。 允许在人脸模糊之前使用“修订”模式编辑元数据文件。 |
Combined |
string |
不需要编辑已分析人脸时,组合模式在一次执行分析和修订步骤。 |
Redact |
string |
修订模式使用分析模式下的元数据文件,并编辑找到的人脸。 |
Fade
描述应用于输入媒体的淡化效果的属性。
名称 | 类型 | 说明 |
---|---|---|
duration |
string |
视频中淡出效果的持续时间。 该值可以采用 ISO 8601 格式 (例如,PT05S 表示在) 5 秒内淡入/淡出颜色,或帧计数 (例如,10 表示从开始时间) 淡出 10 帧,或相对于流持续时间 (的相对值例如,10% 表示淡出 10% 的流持续时间) |
fadeColor |
string |
淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上:例如:rgb (255,0,0) 、0xFF0000 或 #FF0000 |
start |
string |
输入视频中开始淡出的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 默认值为 0 |
Filters
描述编码前要应用于输入媒体的所有筛选操作,例如去隔行扫描、旋转等。
名称 | 类型 | 说明 |
---|---|---|
crop |
用于裁剪输入视频的矩形窗口的参数。 |
|
deinterlace |
反交错设置。 |
|
fadeIn |
描述应用于输入媒体的淡出效果的属性。 |
|
fadeOut |
描述应用于输入媒体的淡出效果的属性。 |
|
overlays | Overlay[]: |
要应用于输入视频的覆盖的属性。 这些覆盖可以是音频、图像或视频覆盖。 |
rotation |
在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为“自动” |
H264Complexity
告知编码器如何选择其编码设置。 默认值为“平衡”。
名称 | 类型 | 说明 |
---|---|---|
Balanced |
string |
告知编码器使用在速度和质量之间实现平衡的设置。 |
Quality |
string |
告知编码器使用经过优化的设置,以生成更高质量的输出,但代价是总体编码时间变慢。 |
Speed |
string |
告知编码器使用经过优化以加快编码速度的设置。 为了缩短编码时间,会牺牲质量。 |
H264Layer
描述在使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。
名称 | 类型 | 说明 |
---|---|---|
adaptiveBFrame |
boolean |
编码此层时是否要使用自适应 B 帧。 如果未指定,则只要视频配置文件允许使用,编码器就会打开它。 |
bFrames |
integer |
编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 |
bitrate |
integer |
生成此层时要对输入视频进行编码的平均比特率(以位/秒为单位)。 这是必填字段。 |
bufferWindow |
string |
VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应在 [0.1-100] 秒范围内。 默认值为 5 秒 (例如 PT5S) 。 |
crf |
number |
编码此层时要使用的 CRF 值。 此设置在 CRF 模式下设置视频编解码器的 RateControlMode 时生效。 CRF 值的范围在 0 到 51 之间,其中值越低,质量越好,代价是文件大小越大。 值越高意味着压缩程度越高,但在某些时候会注意到质量下降。 默认值为 23。 |
entropyMode |
要用于此层的熵模式。 如果未指定,编码器会选择适合配置文件和级别的模式。 |
|
frameRate |
string |
帧速率 (为此层编码) 每秒帧数。 该值可以是 M/N 的形式,其中 M 和 N 是整数 (例如,30000/1001) ,或者采用数字 (例如,30 或 29.97) 。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 |
height |
string |
此层的输出视频的高度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的高度为输入的一半像素。 |
label |
string |
此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 |
level |
string |
我们目前支持最高级别 6.2。 该值可以是 Auto,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,这允许编码器选择适合此层的级别。 |
maxBitrate |
integer |
最大比特率 (位/秒) ,此时应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 |
profile |
我们目前支持基线、主、高、高、高422、高444。 默认值为“自动”。 |
|
referenceFrames |
integer |
编码此层时要使用的引用帧数。 如果未指定,编码器将根据编码器复杂性设置确定适当的数字。 |
slices |
integer |
编码此层时要使用的切片数。 如果未指定,默认值为零,这意味着编码器将为每个帧使用单个切片。 |
width |
string |
此层的输出视频的宽度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的像素宽度是输入的一半。 |
H264RateControlMode
视频速率控制模式
名称 | 类型 | 说明 |
---|---|---|
ABR |
string |
命中目标比特率 (ABR) 模式的平均比特率:默认模式。 |
CBR |
string |
固定比特率 (CBR) 模式,该模式紧固目标比特率周围的比特率变化。 |
CRF |
string |
恒定速率因子 (以恒定主观质量为目标的 CRF) 模式。 |
H264Video
介绍使用 H.264 编解码器对视频进行编码的所有属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
complexity |
告知编码器如何选择其编码设置。 默认值为“平衡”。 |
|
keyFrameInterval |
string |
两个关键帧之间的距离。 该值应为以 ISO 8601 格式指定的 [0.5, 20] 秒范围内的非零。 默认值为 PT2S) (2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
layers |
要由编码器生成的输出 H.264 层的集合。 |
|
rateControlMode |
视频速率控制模式 |
|
sceneChangeDetection |
boolean |
编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 |
stretchMode |
调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize |
|
syncMode |
视频同步模式 |
H264VideoProfile
我们目前支持 Baseline、Main、High、High422、High444。 默认值为“自动”。
名称 | 类型 | 说明 |
---|---|---|
Auto |
string |
告知编码器自动确定适当的 H.264 配置文件。 |
Baseline |
string |
基线配置文件 |
High |
string |
高调。 |
High422 |
string |
高 4:2:2 配置文件。 |
High444 |
string |
高 4:4:4 预测配置文件。 |
Main |
string |
主配置文件 |
H265Complexity
告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快、更经济。 默认值为“平衡”。
名称 | 类型 | 说明 |
---|---|---|
Balanced |
string |
告知编码器使用在速度和质量之间实现平衡的设置。 |
Quality |
string |
告知编码器使用经过优化的设置,以生成更高质量的输出,但代价是总体编码时间变慢。 |
Speed |
string |
告知编码器使用经过优化以加快编码速度的设置。 为了缩短编码时间,会牺牲质量。 |
H265Layer
描述在使用 H.265 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。
名称 | 类型 | 说明 |
---|---|---|
adaptiveBFrame |
boolean |
指定编码此层时是否要使用自适应 B 帧。 如果未指定,则只要视频配置文件允许使用,编码器就会打开它。 |
bFrames |
integer |
编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 |
bitrate |
integer |
生成此层时要对输入视频进行编码的平均比特率(以位/秒为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 意味着此值应为 3000000 这是必填字段。 |
bufferWindow |
string |
VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应在 [0.1-100] 秒范围内。 默认值为 5 秒 (例如 PT5S) 。 |
crf |
number |
编码此层时要使用的 CRF 值。 此设置在 CRF 模式下设置视频编解码器的 RateControlMode 时生效。 CRF 值的范围在 0 到 51 之间,其中值越低,质量越好,代价是文件大小越大。 值越高意味着压缩程度越高,但在某些时候会注意到质量下降。 默认值为 28。 |
frameRate |
string |
帧速率 (为此层编码) 每秒帧数。 该值可以是 M/N 的形式,其中 M 和 N 是整数 (例如,30000/1001) ,或者采用数字 (例如,30 或 29.97) 。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 |
height |
string |
此层的输出视频的高度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的高度为输入的一半像素。 |
label |
string |
此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 |
level |
string |
我们目前支持最高级别 6.2。 该值可以是 Auto,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,这允许编码器选择适合此层的级别。 |
maxBitrate |
integer |
最大比特率 (位/秒) ,此时应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 |
profile |
我们目前支持 Main。 默认值为“自动”。 |
|
referenceFrames |
integer |
编码此层时要使用的引用帧数。 如果未指定,编码器将根据编码器复杂性设置确定适当的数字。 |
slices |
integer |
编码此层时要使用的切片数。 如果未指定,默认值为零,这意味着编码器将为每个帧使用单个切片。 |
width |
string |
此层的输出视频的宽度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的像素宽度是输入的一半。 |
H265Video
描述使用 H.265 编解码器对视频进行编码的所有属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
complexity |
告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快且更经济。 默认值为 Balanced。 |
|
keyFrameInterval |
string |
两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
layers |
编码器要生成的输出 H.265 层的集合。 |
|
sceneChangeDetection |
boolean |
指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 |
stretchMode |
调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize |
|
syncMode |
视频同步模式 |
H265VideoProfile
我们目前支持 Main。 默认值为“自动”。
名称 | 类型 | 说明 |
---|---|---|
Auto |
string |
告知编码器自动确定相应的 H.265 配置文件。 |
Main |
string |
主配置文件 (https://x265.readthedocs.io/en/default/cli.html?highlight=profile#profile-level-tier) |
Main10 |
string |
主 10 配置文件 (https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#Main_10) |
Image
介绍用于从输入视频生成缩略图的基本属性
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
keyFrameInterval |
string |
两个关键帧之间的距离。 该值应为以 ISO 8601 格式指定的 [0.5, 20] 秒范围内的非零。 默认值为 PT2S) (2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
range |
string |
相对于转换输入视频中预设开始时间的位置,该时间将停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。 |
start |
string |
输入视频中开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。 |
step |
string |
生成缩略图的间隔。 该值可以采用 ISO 8601 格式 (例如,PT05S 表示每 5 秒) 一张图像,或者帧计数 (例如,每 30 帧) 一张图像 30,或者流持续时间 (例如,每 10% 流持续时间) 一个图像的 10%。 注意:步骤值将影响第一个生成的缩略图,该缩略图可能不完全是转换预设开始时间指定的缩略图。 这是由于编码器尝试选择开始时间与步骤位置之间的最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则生成的第一个缩略图可能远离在开始时间指定的缩略图。 如果预计第一个缩略图接近开始时间,请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图,则尝试将 Range 值设置为 1。 |
stretchMode |
调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize |
|
syncMode |
视频同步模式 |
ImageFormat
描述输出图像文件的属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
filenamePattern |
string |
用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。 |
InsightsType
定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅视频,则仅生成视频见解。 如果你希望某些输入仅使用视频,建议不要使用 AudioInsightsOnly;或者,如果你希望某些输入仅是音频,请使用 VideoInsightsOnly。 在这种情况下,作业将出错。
名称 | 类型 | 说明 |
---|---|---|
AllInsights |
string |
生成音频和视频见解。 如果音频或视频见解失败,则失败。 |
AudioInsightsOnly |
string |
生成仅限音频的见解。 即使存在,也忽略视频。 如果没有音频,则失败。 |
VideoInsightsOnly |
string |
生成仅视频见解。 忽略音频(如果存在)。 如果没有视频,则失败。 |
InterleaveOutput
设置输出的交错模式,以控制以容器格式存储音频和视频的方式。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅限音频和仅视频的输出。
名称 | 类型 | 说明 |
---|---|---|
InterleavedOutput |
string |
输出包括音频和视频。 |
NonInterleavedOutput |
string |
输出为仅视频或仅音频。 |
JpgFormat
描述用于生成 JPEG 缩略图的设置。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
filenamePattern |
string |
用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。 |
JpgImage
介绍用于从输入视频生成一系列 JPEG 图像的属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
keyFrameInterval |
string |
两个关键帧之间的距离。 该值应为以 ISO 8601 格式指定的 [0.5, 20] 秒范围内的非零。 默认值为 PT2S) (2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
layers |
Jpg |
要由编码器生成的输出 JPEG 图像层的集合。 |
range |
string |
相对于转换输入视频中预设开始时间的位置,该时间将停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。 |
spriteColumn |
integer |
设置缩略图子画面图像中使用的列数。 将自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。 |
start |
string |
输入视频中开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。 |
step |
string |
生成缩略图的间隔。 该值可以采用 ISO 8601 格式 (例如,PT05S 表示每 5 秒) 一张图像,或者帧计数 (例如,每 30 帧) 一张图像 30,或者流持续时间 (例如,每 10% 流持续时间) 一个图像的 10%。 注意:步骤值将影响第一个生成的缩略图,该缩略图可能不完全是转换预设开始时间指定的缩略图。 这是由于编码器尝试选择开始时间与步骤位置之间的最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则生成的第一个缩略图可能远离在开始时间指定的缩略图。 如果预计第一个缩略图接近开始时间,请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图,则尝试将 Range 值设置为 1。 |
stretchMode |
调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize |
|
syncMode |
视频同步模式 |
JpgLayer
描述从输入视频生成 JPEG 图像的设置。
名称 | 类型 | 说明 |
---|---|---|
height |
string |
此层的输出视频的高度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的高度为输入的一半像素。 |
label |
string |
此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 |
quality |
integer |
JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。 |
width |
string |
此层的输出视频的宽度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的像素宽度是输入的一半。 |
Mp4Format
描述输出 ISO MP4 文件的属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
filenamePattern |
string |
用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。 |
outputFiles |
要生成的输出文件的列表。 列表中的每个条目都是一组要复用在一起的音频和视频层标签。 |
MultiBitrateFormat
描述用于生成 GOP 对齐的多比特率文件集合的属性。 默认行为是为每个视频层生成一个输出文件,该文件与所有音频一起复用。 可以通过指定 outputFiles 集合来控制生成的确切输出文件。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
filenamePattern |
string |
用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。 |
outputFiles |
要生成的输出文件的列表。 列表中的每个条目都是一组要复用在一起的音频和视频层标签。 |
OnErrorType
转换可以定义多个输出。 此属性定义当一个输出失败时服务应执行的操作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。
名称 | 类型 | 说明 |
---|---|---|
ContinueJob |
string |
告知服务,如果此 TransformOutput 失败,则允许任何其他 TransformOutput 继续。 |
StopProcessingJob |
string |
告知服务,如果此 TransformOutput 失败,则可以停止任何其他不完整的 TransformOutput。 |
OutputFile
表示生成的输出文件。
名称 | 类型 | 说明 |
---|---|---|
labels |
string[] |
描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成两个带有标签 v1 和 v2 的视频层,以及一个带有标签 a1 的视频层,则类似“[v1, a1]”的数组会告知编码器生成一个输出文件,其中包含由 v1 表示的视频轨迹和由 a1 表示的音频轨道。 |
PngFormat
描述用于生成 PNG 缩略图的设置。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
filenamePattern |
string |
用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件长度小于 32 个字符) ,则不包括文件后缀 (基名称,将使用输入视频文件的基本名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。 |
PngImage
介绍用于从输入视频生成一系列 PNG 图像的属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
keyFrameInterval |
string |
两个关键帧之间的距离。 该值应为以 ISO 8601 格式指定的 [0.5, 20] 秒范围内的非零。 默认值为 PT2S) (2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
layers |
Png |
要由编码器生成的输出 PNG 图像层的集合。 |
range |
string |
相对于转换输入视频中预设开始时间的位置,该时间将停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。 |
start |
string |
输入视频中开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。 |
step |
string |
生成缩略图的间隔。 该值可以采用 ISO 8601 格式 (例如,PT05S 表示每 5 秒) 一张图像,或者帧计数 (例如,每 30 帧) 一张图像 30,或者流持续时间 (例如,每 10% 流持续时间) 一个图像的 10%。 注意:步骤值将影响第一个生成的缩略图,该缩略图可能不完全是转换预设开始时间指定的缩略图。 这是由于编码器尝试选择开始时间与步骤位置之间的最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则生成的第一个缩略图可能远离在开始时间指定的缩略图。 如果预计第一个缩略图接近开始时间,请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图,则尝试将 Range 值设置为 1。 |
stretchMode |
调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize |
|
syncMode |
视频同步模式 |
PngLayer
描述从输入视频生成 PNG 图像的设置。
名称 | 类型 | 说明 |
---|---|---|
height |
string |
此层的输出视频的高度。 该值可以是绝对 ((以像素) 为单位),也可以是相对 ((以百分比) 为单位)。 例如,50% 表示输出视频的高度是输入像素的一半。 |
label |
string |
此层的字母数字标签,可用于多路复用不同的视频和音频层,或命名输出文件。 |
width |
string |
此层的输出视频的宽度。 该值可以是绝对 (像素) ,也可以是相对 (百分比) 。 例如,50% 表示输出视频的像素宽度是输入的一半。 |
PresetConfigurations
编码器的可选配置设置的对象。
名称 | 类型 | 说明 |
---|---|---|
complexity |
可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将“复杂性”设置为“速度”,以加快编码速度,但降低压缩效率。 |
|
interleaveOutput |
设置输出的交错模式,以控制音频和视频以容器格式存储的方式。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。 |
|
keyFrameIntervalInSeconds |
number |
关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。 |
maxBitrateBps |
integer |
最高视频层) (阈值的最大比特率(以位/秒为单位)。 示例:将 MaxBitrateBps 设置为 6000000,以避免为高复杂度的内容生成非常高的比特率输出。 |
maxHeight |
integer |
输出视频层的最大高度。 示例:将 MaxHeight 设置为 720 以生成高达 720P 的输出层,即使输入为 4K 也是如此。 |
maxLayers |
integer |
输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,以确保最多生成 4 个输出层,以控制编码作业的总体成本。 |
minBitrateBps |
integer |
底部视频层) 的最小比特率 (阈值(以比特/秒为单位)。 示例:将 MinBitrateBps 设置为 200000,以创建一个覆盖低网络带宽用户的底层。 |
minHeight |
integer |
输出视频层的最小高度。 示例:将 MinHeight 设置为 360 以避免输出层的较小分辨率(如 180P)。 |
Priority
设置转换中 TransformOutputs 的相对优先级。 这将设置服务用于处理 TransformOutput 的优先级。 默认优先级为 Normal。
名称 | 类型 | 说明 |
---|---|---|
High |
string |
用于应优先于其他转换输出。 |
Low |
string |
用于可在正常和高优先级 TransformOutputs 之后生成的 TransformOutput。 |
Normal |
string |
用于可在普通优先级下生成的 TransformOutput。 |
Rectangle
描述在处理输入媒体之前应用于输入媒体的矩形窗口的属性。
名称 | 类型 | 说明 |
---|---|---|
height |
string |
矩形区域的高度(以像素为单位)。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。 |
left |
string |
左边距的像素数。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。 |
top |
string |
上边距的像素数。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。 |
width |
string |
矩形区域的宽度(以像素为单位)。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。 |
Rotation
在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为 Auto
名称 | 类型 | 说明 |
---|---|---|
Auto |
string |
根据需要自动检测和旋转。 |
None |
string |
不要旋转视频。 如果输出格式支持,则有关旋转的任何元数据将保持不变。 |
Rotate0 |
string |
不要旋转视频,但删除有关旋转的任何元数据。 |
Rotate180 |
string |
顺时针旋转 180 度。 |
Rotate270 |
string |
顺时针旋转 270 度。 |
Rotate90 |
string |
顺时针旋转 90 度。 |
StandardEncoderPreset
介绍在使用标准编码器对输入视频进行编码时要使用的所有设置。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
codecs | Codec[]: |
编码输入视频时要使用的编解码器列表。 |
experimentalOptions |
object |
包含未在预设本身中公开的参数的键值对的字典 |
filters |
编码前应用于输入媒体的一个或多个筛选操作。 |
|
formats | Format[]: |
编码器要生成的输出列表。 |
StretchMode
调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize
名称 | 类型 | 说明 |
---|---|---|
AutoFit |
string |
使用信箱或支柱框) 填充输出 (,以遵循输出分辨率,同时确保输出中的活动视频区域具有与输入相同的纵横比。 例如,如果输入为 1920x1080,编码预设要求为 1280x1280,则输出将为 1280x1280,其中包含一个纵横比为 1280x720 的内部矩形(纵横比为 16:9),柱形框区域在左侧和右侧为 280 像素宽。 |
AutoSize |
string |
重写输出分辨率,并更改它以匹配输入的显示纵横比,而无需填充。 例如,如果输入为 1920x1080,而编码预设要求提供 1280x1280,则会重写预设中的值,输出将是 1280x720,这样可以保持 16:9 的输入纵横比。 |
None |
string |
严格遵循输出分辨率,而不考虑输入视频的像素纵横比或显示纵横比。 |
systemData
与资源的创建和上次修改相关的元数据。
名称 | 类型 | 说明 |
---|---|---|
createdAt |
string |
资源创建时间戳 (UTC) 。 |
createdBy |
string |
创建资源的标识。 |
createdByType |
创建资源的标识类型。 |
|
lastModifiedAt |
string |
资源上次修改的时间戳 (UTC) |
lastModifiedBy |
string |
上次修改资源的标识。 |
lastModifiedByType |
上次修改资源的标识类型。 |
Transform
转换封装用于从输入媒体生成所需输出的规则或指令,例如通过转码或提取见解。 创建转换后,可以通过创建作业将其应用于输入媒体。
名称 | 类型 | 说明 |
---|---|---|
id |
string |
资源的完全限定的资源 ID。 例如 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
name |
string |
资源的名称 |
properties.created |
string |
创建转换时的 UTC 日期和时间,格式为“YYYY-MM-DDThh:mm:ssZ”。 |
properties.description |
string |
转换的可选详细说明。 |
properties.lastModified |
string |
上次更新转换的 UTC 日期和时间,格式为“YYYY-MM-DDThh:mm:ssZ”。 |
properties.outputs |
转换应该生成的一个或多个 TransformOutput 的数组。 |
|
systemData |
与此资源相关的系统元数据。 |
|
type |
string |
资源类型。 例如“Microsoft.Compute/virtualMachines”或“Microsoft.Storage/storageAccounts” |
TransformOutput
描述 TransformOutput 的属性,这些属性是在生成所需输出时要应用的规则。
名称 | 类型 | 说明 |
---|---|---|
onError |
转换可以定义多个输出。 此属性定义当一个输出失败时服务应执行的操作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。 |
|
preset | Preset: |
描述将用于修改、转码或从源文件中提取见解以生成输出的操作的预设。 |
relativePriority |
设置转换中 TransformOutputs 的相对优先级。 这将设置服务用于处理 TransformOutput 的优先级。 默认优先级为 Normal。 |
TransportStreamFormat
介绍用于生成 MPEG-2 传输流 (ISO/IEC 13818-1) 输出视频文件 () 的属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
filenamePattern |
string |
用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件的名称的扩展宏。 如果输入视频文件的基名称 (文件后缀不包含) 少于 32 个字符,则将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。 |
outputFiles |
要生成的输出文件的列表。 列表中的每个条目都是一组要复用在一起的音频和视频层标签。 |
Video
介绍用于编码输入视频的基本属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
keyFrameInterval |
string |
两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。 |
label |
string |
编解码器的可选标签。 标签可用于控制复用行为。 |
stretchMode |
调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize |
|
syncMode |
视频同步模式 |
VideoAnalyzerPreset
视频分析器预设,用于从音频和视频中提取见解 (丰富的元数据) ,并输出 JSON 格式化文件。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
audioLanguage |
string |
使用“语言标记区域”的 BCP-47 格式的输入中的音频有效负载的语言 (例如:“en-US”) 。 如果你知道内容的语言,建议你指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为自动语言检测不包括在基本模式下。 如果未指定语言或将语言设置为 null,自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。 它目前不支持在检测到第一种语言后在各语言之间进行动态切换。 自动检测最适用于具有清晰可辨识语音的录音。 如果自动检测找不到语言,听录将回退到'en-US'。此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463 |
experimentalOptions |
object |
包含未在预设本身中公开的参数的键值对的字典 |
insightsToExtract |
定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅视频,则仅生成视频见解。 如果你希望某些输入仅使用视频,建议不要使用 AudioInsightsOnly;或者,如果你希望某些输入仅是音频,请使用 VideoInsightsOnly。 在这种情况下,作业将出错。 |
|
mode |
确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。 |
VideoOverlay
描述视频覆盖的属性。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
派生类型的鉴别器。 |
audioGainLevel |
number |
覆盖中音频的增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。 |
cropRectangle |
用于裁剪覆盖图像或视频的可选矩形窗口。 |
|
end |
string |
结束位置(引用了覆盖结束处的输入视频)。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频的 30 秒处结束覆盖。 如果未指定或该值大于输入视频持续时间,则覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。 |
fadeInDuration |
string |
覆盖淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是无淡入 (与 PT0S) 相同。 |
fadeOutDuration |
string |
覆盖淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是没有淡出 (与 PT0S) 相同。 |
inputLabel |
string |
要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件,或者指定音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件。 有关支持的音频和视频文件格式的完整列表,请参阅 https://aka.ms/mesformats 。 |
opacity |
number |
覆盖层的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,这意味着覆盖不透明。 |
position |
输入视频中应用覆盖的位置。 |
|
start |
string |
开始位置(引用了覆盖层开始的输入视频)。 该值应采用 ISO 8601 格式。 例如,PT05S 在 5 秒处开始覆盖输入视频。 如果未指定,覆盖层将从输入视频的开头开始。 |
VideoSyncMode
视频同步模式
名称 | 类型 | 说明 |
---|---|---|
Auto |
string |
这是默认方法。 根据复用器功能在 Cfr 和 Vfr 之间进行选择。 对于输出格式 MP4,默认模式为 Cfr。 |
Cfr |
string |
将根据需要重复和/或删除输入帧,以完全达到所请求的恒定帧速率。 当输出帧速率显式设置为指定值时,建议使用 |
Passthrough |
string |
帧上的演示文稿时间戳从输入文件传递到输出文件编写器。 当输入源具有可变帧速率,并且尝试在具有对齐 GOP 边界的输出中生成多个自适应流式处理层时,建议使用 。 注意:如果输入中的两个或更多帧具有重复的时间戳,则输出也将具有相同的行为 |
Vfr |
string |
类似于传递模式,但如果输入具有重复时间戳的帧,则只有一个帧传递到输出,而其他帧则被删除。 当输出帧数应等于输入帧数时,建议使用。 例如,输出用于根据输入计算质量指标(如 PSNR) |