structure DML_ELEMENT_WISE_ADD1_OPERATOR_DESC (directml.h)
Ajoute chaque élément d’ATensor à son élément correspondant dans BTensor et place le résultat dans l’élément OutputTensor correspondant, avec l’option d’activation fusionnée.
f(a, b) = FusedActivation(a + b)
La description de l’opérateur d’activation fusionnée, si elle est fournie, exécute ensuite l’opérateur d’activation donné sur la sortie.
Cet opérateur prend en charge l’exécution sur place, ce qui signifie que OutputTensor est autorisé à aliaser un ou plusieurs des tenseurs d’entrée pendant la liaison.
Syntaxe
struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_OPERATOR_DESC *FusedActivation;
};
Membres
ATensor
Type : const DML_TENSOR_DESC*
Tenseur contenant les entrées de gauche.
BTensor
Type : const DML_TENSOR_DESC*
Tenseur contenant les entrées de droite.
OutputTensor
Type : const DML_TENSOR_DESC*
Tenseur de sortie dans lequel écrire les résultats.
FusedActivation
Type : _Maybenull_ const DML_OPERATOR_DESC*
Couche d’activation fusionnée facultative à appliquer après l’ajout. Pour plus d’informations, consultez Utilisation d’opérateurs fusionnés pour améliorer les performances.
L’activation fusionnée ne peut être utilisée que lorsque le type de données de sortie est FLOAT16 ou FLOAT32.
Remarques
Disponibilité
Cet opérateur a été introduit dans DML_FEATURE_LEVEL_2_0
.
Contraintes tensoriels
ATensor, BTensor et OutputTensor doivent avoir les mêmes DataType, DimensionCount et Sizes.
Prise en charge de Tensor
DML_FEATURE_LEVEL_3_0 et versions ultérieures
Tenseur | Genre | Nombre de dimensions pris en charge | Types de données pris en charge |
---|---|---|---|
ATensor | Entrée | 1 à 8 | FLOAT32, FLOAT16 |
BTensor | Entrée | 1 à 8 | FLOAT32, FLOAT16 |
OutputTensor | Sortie | 1 à 8 | FLOAT32, FLOAT16 |
DML_FEATURE_LEVEL_2_0 et versions ultérieures
Tenseur | Genre | Nombre de dimensions pris en charge | Types de données pris en charge |
---|---|---|---|
ATensor | Entrée | 4 à 5 | FLOAT32, FLOAT16 |
BTensor | Entrée | 4 à 5 | FLOAT32, FLOAT16 |
OutputTensor | Sortie | 4 à 5 | FLOAT32, FLOAT16 |
Configuration requise
Condition requise | Valeur |
---|---|
Client minimal pris en charge | Windows 10, version 2004 (10.0 ; Build 19041) |
Serveur minimal pris en charge | Windows Server, version 2004 (10.0 ; Build 19041) |
En-tête | directml.h |