DML_QUANTIZED_LINEAR_AVERAGE_POOLING_OPERATOR_DESC 结构 (directml.h)

项目
03/14/2024

通过输入张量计算滑动窗口中元素的量化值的平均值。此运算符在数学上等效于对输入进行去量化、平均池化，然后量化输出。

去量化函数

f(Input, Scale, ZeroPoint) = (Input - ZeroPoint) * Scale

量化函数

f(Input, Scale, ZeroPoint) = clamp(round(Input / Scale) + ZeroPoint, Min, Max)

重要

此 API 作为 DirectML 独立可再发行组件包的一部分提供（请参阅 Microsoft.AI.DirectML 版本 1.13 及更高版本。另请参阅 DirectML 版本历史记录。

语法

struct DML_QUANTIZED_LINEAR_AVERAGE_POOLING_OPERATOR_DESC
{
    const DML_TENSOR_DESC* InputTensor;
    const DML_TENSOR_DESC* InputScaleTensor;
    _Maybenull_ const DML_TENSOR_DESC* InputZeroPointTensor;
    const DML_TENSOR_DESC* OutputScaleTensor;
    _Maybenull_ const DML_TENSOR_DESC* OutputZeroPointTensor;
    const DML_TENSOR_DESC* OutputTensor;
    UINT DimensionCount;
    _Field_size_(DimensionCount) const UINT* Strides;
    _Field_size_(DimensionCount) const UINT* WindowSize;
    _Field_size_(DimensionCount) const UINT* StartPadding;
    _Field_size_(DimensionCount) const UINT* EndPadding;
    _Field_size_(DimensionCount) const UINT* Dilations;
    BOOL IncludePadding;
};

成员

InputTensor

类型：const DML_TENSOR_DESC*

具有 4D 大小 { BatchCount, ChannelCount, Height, Width } 和 5D 大小 { BatchCount, ChannelCount, Depth, Height, Weight } 的输入张量。

InputScaleTensor

类型：const DML_TENSOR_DESC*

包含 InputTensor 刻度数据的张量。如果需要按张量量化，则 InputScaleTensor 的预期维度为 { 1, 1, 1, 1 }，或者如果需要按通道量化，则预期维度为 { 1, ChannelCount, 1, 1 }。这些刻度值用于对 InputTensor 值进行去量化。

InputZeroPointTensor

类型：_Maybenull_ const DML_TENSOR_DESC*

包含 InputTensor 零点数据的可选张量。如果需要按张量量化，则 InputZeroPointTensor 的预期维度为 { 1, 1, 1, 1 }，或者如果需要按通道量化，则预期维度为 { 1, ChannelCount, 1, 1 }。这些零点值用于对 InputTensor 值进行去量化。

OutputScaleTensor

类型：const DML_TENSOR_DESC*

包含 OutputTensor 刻度数据的张量。如果需要按张量量化，则 OutputScaleTensor 的预期维度为 { 1, 1, 1, 1 }，或者如果需要按通道量化，则预期维度为 { 1, ChannelCount, 1, 1 }。这些刻度值用于量化 OutputTensor 值。

OutputZeroPointTensor

类型：_Maybenull_ const DML_TENSOR_DESC*

包含 OutputTensor 零点数据的可选张量。如果需要按张量量化，则 OutputZeroPointTensor 的预期维度为 { 1, 1, 1, 1 }，或者如果需要按通道量化，则预期维度为 { 1, ChannelCount, 1, 1 }。此零点值用于量化 OutputTensor 值。

OutputTensor

类型：const DML_TENSOR_DESC*

输出张量的说明。可以如下所示计算输出张量的大小。

OutputTensor->Sizes[0] = InputTensor->Sizes[0];
OutputTensor->Sizes[1] = InputTensor->Sizes[1];

for (UINT i = 0; i < DimensionCount; ++i) {
  UINT PaddedSize = InputTensor->Sizes[i + 2] + StartPadding[i] + EndPadding[i];
  OutputTensor->Sizes[i + 2] = (PaddedSize - WindowSizes[i]) / Strides[i] + 1;
}

DimensionCount

类型：UINT

输入张量 InputTensor 的空间维度数，也对应于滑动窗口 WindowSize 的维度数。此值还可用于确定 Strides、StartPadding 和 EndPadding 数组的大小。当 InputTensor 为 4D 张量时，应设置为 2，当它为 5D 张量时，应设置为 3。

Strides