DML_ELEMENT_WISE_ADD1_OPERATOR_DESC結構 (directml.h)
將 ATensor 中的每個元素加入至 BTensor 中的對應元素,並將結果放入 OutputTensor 的對應元素,並搭配使用 fused 啟用的選項。
f(a, b) = FusedActivation(a + b)
如果提供,則會在輸出上執行指定啟用運算子的融合啟用運算符描述。
這個運算符支援就地執行,這表示在系結期間允許 OutputTensor 將一或多個輸入張量別名。
語法
struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_OPERATOR_DESC *FusedActivation;
};
成員
ATensor
類型: const DML_TENSOR_DESC*
包含左側輸入的張量。
BTensor
類型: const DML_TENSOR_DESC*
包含右側輸入的張量。
OutputTensor
類型: const DML_TENSOR_DESC*
要寫入結果的輸出張量。
FusedActivation
類型:_Maybenull_ const DML_OPERATOR_DESC*
要在加法之後套用的選擇性融合啟用層。 如需詳細資訊,請參閱 使用融合運算符來改善效能。
只有在輸出數據類型 FLOAT16 或 FLOAT32時,才能使用 Fused 啟用。
備註
可用性
這個運算子是在 中 DML_FEATURE_LEVEL_2_0
引進。
Tensor 條件約束
ATensor、 BTensor 和 OutputTensor 必須具有相同 的 DataType、 DimensionCount 和 Sizes。
Tensor 支援
DML_FEATURE_LEVEL_3_0和更新版本
張 | 種類 | 支援的維度計數 | 支援的資料類型 |
---|---|---|---|
ATensor | 輸入 | 1 到 8 | FLOAT32,FLOAT16 |
BTensor | 輸入 | 1 到 8 | FLOAT32,FLOAT16 |
OutputTensor | 輸出 | 1 到 8 | FLOAT32,FLOAT16 |
DML_FEATURE_LEVEL_2_0和更新版本
張 | 種類 | 支援的維度計數 | 支援的資料類型 |
---|---|---|---|
ATensor | 輸入 | 4 到 5 | FLOAT32,FLOAT16 |
BTensor | 輸入 | 4 到 5 | FLOAT32,FLOAT16 |
OutputTensor | 輸出 | 4 到 5 | FLOAT32,FLOAT16 |
規格需求
需求 | 值 |
---|---|
最低支援的用戶端 | Windows 10 版本 2004 (10.0;組建 19041) |
最低支援的伺服器 | Windows Server 版本 2004 (10.0;組建 19041) |
標頭 | directml.h |