DML_ELEMENT_WISE_ADD1_OPERATOR_DESC結構 (directml.h)

發行項
02/28/2024

將 ATensor 中的每個元素加入至 BTensor 中的對應元素，並將結果放入 OutputTensor 的對應元素，並搭配使用 fused 啟用的選項。

f(a, b) = FusedActivation(a + b)

如果提供，則會在輸出上執行指定啟用運算子的融合啟用運算符描述。

這個運算符支援就地執行，這表示在系結期間允許 OutputTensor 將一或多個輸入張量別名。

語法

struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
  const DML_TENSOR_DESC   *ATensor;
  const DML_TENSOR_DESC   *BTensor;
  const DML_TENSOR_DESC   *OutputTensor;
  const DML_OPERATOR_DESC *FusedActivation;
};

成員

ATensor

類型： const DML_TENSOR_DESC*

包含左側輸入的張量。

BTensor

類型： const DML_TENSOR_DESC*

包含右側輸入的張量。

OutputTensor

類型： const DML_TENSOR_DESC*

要寫入結果的輸出張量。

FusedActivation

類型：_Maybenull_ const DML_OPERATOR_DESC*

要在加法之後套用的選擇性融合啟用層。如需詳細資訊，請參閱使用融合運算符來改善效能。

只有在輸出數據類型 FLOAT16 或 FLOAT32時，才能使用 Fused 啟用。

備註

可用性

這個運算子是在中 DML_FEATURE_LEVEL_2_0引進。

Tensor 條件約束

ATensor、 BTensor 和 OutputTensor 必須具有相同 的 DataType、 DimensionCount 和 Sizes。

Tensor 支援

DML_FEATURE_LEVEL_3_0和更新版本

張	種類	支援的維度計數	支援的資料類型
ATensor	輸入	1 到 8	FLOAT32，FLOAT16
BTensor	輸入	1 到 8	FLOAT32，FLOAT16
OutputTensor	輸出	1 到 8	FLOAT32，FLOAT16

DML_FEATURE_LEVEL_2_0和更新版本

張	種類	支援的維度計數	支援的資料類型
ATensor	輸入	4 到 5	FLOAT32，FLOAT16
BTensor	輸入	4 到 5	FLOAT32，FLOAT16
OutputTensor	輸出	4 到 5	FLOAT32，FLOAT16

規格需求

需求	值
最低支援的用戶端	Windows 10 版本 2004 (10.0;組建 19041)
最低支援的伺服器	Windows Server 版本 2004 (10.0;組建 19041)
標頭	directml.h

另請參閱

使用融合運算符來提升效能

共用方式為

DML_ELEMENT_WISE_ADD1_OPERATOR_DESC結構 (directml.h)

語法

成員

備註

可用性

Tensor 條件約束

Tensor 支援

DML_FEATURE_LEVEL_3_0和更新版本

DML_FEATURE_LEVEL_2_0和更新版本

規格需求

另請參閱

意見反應

其他資源