Поделиться через


структура DML_ELEMENT_WISE_ADD1_OPERATOR_DESC (directml.h)

Добавляет каждый элемент в ATensor к соответствующему элементу в BTensor и помещает результат в соответствующий элемент OutputTensor с параметром для плавленной активации.

f(a, b) = FusedActivation(a + b)

Описание оператора плавленной активации, если указано, затем выполняет заданный оператор активации в выходных данных.

Этот оператор поддерживает выполнение на месте, то есть OutputTensor может использовать псевдоним одного или нескольких входных тензоров во время привязки.

Синтаксис

struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
  const DML_TENSOR_DESC   *ATensor;
  const DML_TENSOR_DESC   *BTensor;
  const DML_TENSOR_DESC   *OutputTensor;
  const DML_OPERATOR_DESC *FusedActivation;
};

Члены

ATensor

Тип: const DML_TENSOR_DESC*

Тензор, содержащий входные данные слева.

BTensor

Тип: const DML_TENSOR_DESC*

Тензор, содержащий входные данные правой стороны.

OutputTensor

Тип: const DML_TENSOR_DESC*

Выходной тензор для записи результатов.

FusedActivation

Тип: _Maybenull_ const DML_OPERATOR_DESC*

Необязательный слой плавленной активации, применяемый после добавления. Дополнительные сведения см. в разделе Использование слитых операторов для повышения производительности.

Плавленную активацию можно использовать только в том случае, если выходной тип данных FLOAT16 или FLOAT32.

Комментарии

Доступность

Этот оператор появился в DML_FEATURE_LEVEL_2_0.

Ограничения тензоров

ATensor, BTensor и OutputTensor должны иметь одинаковые значения DataType, DimensionCount и Sizes.

Поддержка тензоров

DML_FEATURE_LEVEL_3_0 и выше

Тензор Kind Поддерживаемые счетчики измерений Поддерживаемые типы данных
ATensor Входные данные От 1 до 8 FLOAT32, FLOAT16
BTensor Входные данные От 1 до 8 FLOAT32, FLOAT16
OutputTensor Выходные данные От 1 до 8 FLOAT32, FLOAT16

DML_FEATURE_LEVEL_2_0 и выше

Тензор Kind Поддерживаемые счетчики измерений Поддерживаемые типы данных
ATensor Входные данные От 4 до 5 FLOAT32, FLOAT16
BTensor Входные данные От 4 до 5 FLOAT32, FLOAT16
OutputTensor Выходные данные От 4 до 5 FLOAT32, FLOAT16

Требования

Требование Значение
Минимальная версия клиента Windows 10, версия 2004 (10.0; Сборка 19041)
Минимальная версия сервера Windows Server версии 2004 (10.0; Сборка 19041)
Верхняя часть directml.h

См. также раздел