структура DML_ELEMENT_WISE_ADD1_OPERATOR_DESC (directml.h)
Добавляет каждый элемент в ATensor к соответствующему элементу в BTensor и помещает результат в соответствующий элемент OutputTensor с параметром для плавленной активации.
f(a, b) = FusedActivation(a + b)
Описание оператора плавленной активации, если указано, затем выполняет заданный оператор активации в выходных данных.
Этот оператор поддерживает выполнение на месте, то есть OutputTensor может использовать псевдоним одного или нескольких входных тензоров во время привязки.
Синтаксис
struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_OPERATOR_DESC *FusedActivation;
};
Члены
ATensor
Тип: const DML_TENSOR_DESC*
Тензор, содержащий входные данные слева.
BTensor
Тип: const DML_TENSOR_DESC*
Тензор, содержащий входные данные правой стороны.
OutputTensor
Тип: const DML_TENSOR_DESC*
Выходной тензор для записи результатов.
FusedActivation
Тип: _Maybenull_ const DML_OPERATOR_DESC*
Необязательный слой плавленной активации, применяемый после добавления. Дополнительные сведения см. в разделе Использование слитых операторов для повышения производительности.
Плавленную активацию можно использовать только в том случае, если выходной тип данных FLOAT16 или FLOAT32.
Комментарии
Доступность
Этот оператор появился в DML_FEATURE_LEVEL_2_0
.
Ограничения тензоров
ATensor, BTensor и OutputTensor должны иметь одинаковые значения DataType, DimensionCount и Sizes.
Поддержка тензоров
DML_FEATURE_LEVEL_3_0 и выше
Тензор | Kind | Поддерживаемые счетчики измерений | Поддерживаемые типы данных |
---|---|---|---|
ATensor | Входные данные | От 1 до 8 | FLOAT32, FLOAT16 |
BTensor | Входные данные | От 1 до 8 | FLOAT32, FLOAT16 |
OutputTensor | Выходные данные | От 1 до 8 | FLOAT32, FLOAT16 |
DML_FEATURE_LEVEL_2_0 и выше
Тензор | Kind | Поддерживаемые счетчики измерений | Поддерживаемые типы данных |
---|---|---|---|
ATensor | Входные данные | От 4 до 5 | FLOAT32, FLOAT16 |
BTensor | Входные данные | От 4 до 5 | FLOAT32, FLOAT16 |
OutputTensor | Выходные данные | От 4 до 5 | FLOAT32, FLOAT16 |
Требования
Требование | Значение |
---|---|
Минимальная версия клиента | Windows 10, версия 2004 (10.0; Сборка 19041) |
Минимальная версия сервера | Windows Server версии 2004 (10.0; Сборка 19041) |
Верхняя часть | directml.h |