DML_ELEMENT_WISE_ADD1_OPERATOR_DESC-Struktur (directml.h)
Fügt jedes Element in ATensor dem entsprechenden Element in BTensor hinzu und platziert das Ergebnis in das entsprechende Element von OutputTensor mit der Option für die fusionierte Aktivierung.
f(a, b) = FusedActivation(a + b)
Die Beschreibung des fusionierten Aktivierungsoperators führt dann den angegebenen Aktivierungsoperator für die Ausgabe aus, sofern angegeben.
Dieser Operator unterstützt die direkte Ausführung, was bedeutet, dass OutputTensor während der Bindung mindestens einen der Eingabe tensors aliasen darf.
Syntax
struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
const DML_TENSOR_DESC *ATensor;
const DML_TENSOR_DESC *BTensor;
const DML_TENSOR_DESC *OutputTensor;
const DML_OPERATOR_DESC *FusedActivation;
};
Member
ATensor
Typ: const DML_TENSOR_DESC*
Ein Tensor, der die linksseitigen Eingaben enthält.
BTensor
Typ: const DML_TENSOR_DESC*
Ein Tensor, der die rechten Seiteneingaben enthält.
OutputTensor
Typ: const DML_TENSOR_DESC*
Der Ausgabe tensor, in den die Ergebnisse geschrieben werden sollen.
FusedActivation
Typ: _Maybenull_ const DML_OPERATOR_DESC*
Eine optionale Fused-Aktivierungsebene, die nach dem Hinzufügen angewendet werden soll. Weitere Informationen finden Sie unter Verwenden von fusionierten Operatoren für verbesserte Leistung.
Die Fused-Aktivierung kann nur verwendet werden, wenn der Ausgabedatentyp FLOAT16 oder FLOAT32 ist.
Hinweise
Verfügbarkeit
Dieser Operator wurde in DML_FEATURE_LEVEL_2_0
eingeführt.
Tensoreinschränkungen
ATensor, BTensor und OutputTensor müssen die gleichen DataType, DimensionCount und Sizes aufweisen.
Tensorunterstützung
DML_FEATURE_LEVEL_3_0 und höher
Tensor | Variante | Unterstützte Dimensionsanzahl | Unterstützte Datentypen |
---|---|---|---|
ATensor | Eingabe | 1 bis 8 | FLOAT32, FLOAT16 |
BTensor | Eingabe | 1 bis 8 | FLOAT32, FLOAT16 |
OutputTensor | Ausgabe | 1 bis 8 | FLOAT32, FLOAT16 |
DML_FEATURE_LEVEL_2_0 und höher
Tensor | Variante | Unterstützte Dimensionsanzahl | Unterstützte Datentypen |
---|---|---|---|
ATensor | Eingabe | 4 bis 5 | FLOAT32, FLOAT16 |
BTensor | Eingabe | 4 bis 5 | FLOAT32, FLOAT16 |
OutputTensor | Ausgabe | 4 bis 5 | FLOAT32, FLOAT16 |
Anforderungen
Anforderung | Wert |
---|---|
Unterstützte Mindestversion (Client) | Windows 10, Version 2004 (10.0; Build 19041) |
Unterstützte Mindestversion (Server) | Windows Server, Version 2004 (10.0; Build 19041) |
Kopfzeile | directml.h |