Partager via


structure DML_ELEMENT_WISE_ADD1_OPERATOR_DESC (directml.h)

Ajoute chaque élément d’ATensor à son élément correspondant dans BTensor et place le résultat dans l’élément OutputTensor correspondant, avec l’option d’activation fusionnée.

f(a, b) = FusedActivation(a + b)

La description de l’opérateur d’activation fusionnée, si elle est fournie, exécute ensuite l’opérateur d’activation donné sur la sortie.

Cet opérateur prend en charge l’exécution sur place, ce qui signifie que OutputTensor est autorisé à aliaser un ou plusieurs des tenseurs d’entrée pendant la liaison.

Syntaxe

struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
  const DML_TENSOR_DESC   *ATensor;
  const DML_TENSOR_DESC   *BTensor;
  const DML_TENSOR_DESC   *OutputTensor;
  const DML_OPERATOR_DESC *FusedActivation;
};

Membres

ATensor

Type : const DML_TENSOR_DESC*

Tenseur contenant les entrées de gauche.

BTensor

Type : const DML_TENSOR_DESC*

Tenseur contenant les entrées de droite.

OutputTensor

Type : const DML_TENSOR_DESC*

Tenseur de sortie dans lequel écrire les résultats.

FusedActivation

Type : _Maybenull_ const DML_OPERATOR_DESC*

Couche d’activation fusionnée facultative à appliquer après l’ajout. Pour plus d’informations, consultez Utilisation d’opérateurs fusionnés pour améliorer les performances.

L’activation fusionnée ne peut être utilisée que lorsque le type de données de sortie est FLOAT16 ou FLOAT32.

Remarques

Disponibilité

Cet opérateur a été introduit dans DML_FEATURE_LEVEL_2_0.

Contraintes tensoriels

ATensor, BTensor et OutputTensor doivent avoir les mêmes DataType, DimensionCount et Sizes.

Prise en charge de Tensor

DML_FEATURE_LEVEL_3_0 et versions ultérieures

Tenseur Genre Nombre de dimensions pris en charge Types de données pris en charge
ATensor Entrée 1 à 8 FLOAT32, FLOAT16
BTensor Entrée 1 à 8 FLOAT32, FLOAT16
OutputTensor Sortie 1 à 8 FLOAT32, FLOAT16

DML_FEATURE_LEVEL_2_0 et versions ultérieures

Tenseur Genre Nombre de dimensions pris en charge Types de données pris en charge
ATensor Entrée 4 à 5 FLOAT32, FLOAT16
BTensor Entrée 4 à 5 FLOAT32, FLOAT16
OutputTensor Sortie 4 à 5 FLOAT32, FLOAT16

Configuration requise

Condition requise Valeur
Client minimal pris en charge Windows 10, version 2004 (10.0 ; Build 19041)
Serveur minimal pris en charge Windows Server, version 2004 (10.0 ; Build 19041)
En-tête directml.h

Voir aussi