DML_ELEMENT_WISE_ADD1_OPERATOR_DESC结构 (directml.h)
将 ATensor 中的每个元素添加到 其 BTensor 中的相应元素,并将结果放入 OutputTensor 的相应元素中,以及用于融合激活的选项。
f(a, b) = FusedActivation(a + b)
融合激活运算符说明(如果提供)对输出执行给定的激活运算符。
此运算符支持就地执行,这意味着 允许 OutputTensor 在绑定期间为一个或多个输入张量添加别名。
语法
struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_OPERATOR_DESC *FusedActivation;
};
成员
ATensor
类型: const DML_TENSOR_DESC*
包含左侧输入的张量。
BTensor
类型: const DML_TENSOR_DESC*
包含右侧输入的张量。
OutputTensor
类型: const DML_TENSOR_DESC*
要写入结果的输出张量。
FusedActivation
类型:_Maybenull_ const DML_OPERATOR_DESC*
添加后要应用的可选融合激活层。 有关详细信息,请参阅 使用融合运算符提高性能。
仅当输出数据类型 为FLOAT16 或 FLOAT32时,才能使用融合激活。
注解
可用性
此运算符是在 中 DML_FEATURE_LEVEL_2_0
引入的。
张量约束
ATensor、 BTensor 和 OutputTensor 必须具有相同的 DataType、 DimensionCount 和 Size。
张量支持
DML_FEATURE_LEVEL_3_0 及更高版本
张 | 种类 | 支持的维度计数 | 支持的数据类型 |
---|---|---|---|
ATensor | 输入 | 1 到 8 | FLOAT32、FLOAT16 |
BTensor | 输入 | 1 到 8 | FLOAT32、FLOAT16 |
OutputTensor | 输出 | 1 到 8 | FLOAT32、FLOAT16 |
DML_FEATURE_LEVEL_2_0及更高版本
张 | 种类 | 支持的维度计数 | 支持的数据类型 |
---|---|---|---|
ATensor | 输入 | 4 到 5 | FLOAT32、FLOAT16 |
BTensor | 输入 | 4 到 5 | FLOAT32、FLOAT16 |
OutputTensor | 输出 | 4 到 5 | FLOAT32、FLOAT16 |
要求
要求 | 值 |
---|---|
最低受支持的客户端 | Windows 10,版本 2004 (10.0;内部版本 19041) |
最低受支持的服务器 | Windows Server 版本 2004 (10.0;内部版本 19041) |
标头 | directml.h |