_mm256_maddsub_pd
更新 : 2011 年 3 月
Visual Studio 2010 SP1 が必要です。
Microsoft 固有の仕様 →
FMA4 YMM 命令 vfmaddsubpd を生成して、ソースに対して丸め操作 1 回の浮動小数点積和/積差を交互に実行します。
__m256d _mm256_maddsub_pd (
__m256d src1,
__m256d src2,
__m256d src3
);
パラメーター
[入力] src1
4 個の 64 ビット浮動小数点値を含む 256 ビットのパラメーター。[入力] src2
4 個の 64 ビット浮動小数点値を含む 256 ビットのパラメーター。[入力] src3
4 個の 64 ビット浮動小数点値を含む 256 ビットのパラメーター。
戻り値
4 個の 64 ビット浮動小数点値を含む 256 ビットの結果 r。
r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd
必要条件
組み込み |
アーキテクチャ |
---|---|
_mm256_maddsub_pd |
FMA4 |
ヘッダー ファイル <intrin.h>
解説
src1 の 4 個の各倍精度浮動小数点値と src2 の対応する値が乗算されます。 src3 の偶数の各ソース値がそれに対応する積から減算され、奇数の各値がそれに対応する積に加算されます。それぞれの結果がターゲットの対応する値として格納されます。 積和/積差の各ペアの実行時には、中間結果が無限の精度で計算されたかのように、最後に丸め操作が 1 回行われます。
vfmaddsubps 命令は、FMA4 ファミリの命令の一部です。 この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。 この命令に対するハードウェア サポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 16 をチェックします。 このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。
使用例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m256d a, b, c, d;
int i;
for (i = 0; i < 4; i++) {
a.m256d_f64[i] = i;
b.m256d_f64[i] = 2.;
c.m256d_f64[i] = 3.;
}
d = _mm256_maddsub_pd(a, b, c);
for (i = 0; i < 4; i++) printf_s(" %.3lf", d.m256d_f64[i]);
printf_s("\n");
}
参照
参照
その他の技術情報
Visual Studio 2010 SP1 用に追加された FMA4 組み込み
履歴の変更
日付 |
履歴 |
理由 |
---|---|---|
2011 年 3 月 |
このコンテンツを追加。 |
SP1 機能変更 |