_mm_haddd_epu8
更新 : 2011 年 3 月
Visual Studio 2010 SP1 が必要です。
Microsoft 固有の仕様 →
XOP 命令 vphaddubd を生成して、ソースに対して符号なし整数水平加算を実行します。
__m128i _mm_haddd_epu8 (
__m128i src
);
パラメーター
- [入力] src
16 個の 8 ビット符号なし整数を含む 128 ビットのパラメーター。
戻り値
4 個の 32 ビット符号なし整数を含む 128 ビットの結果 r。
r[i] := src[4*i] + src[4*i+1] + src[4*i+2] + src[4*i+3];
必要条件
組み込み |
アーキテクチャ |
---|---|
_mm_haddd_epu8 |
XOP |
ヘッダー ファイル <intrin.h>
解説
src の 4 個の 8 ビット符号なし整数値の 4 個の各グループが加算され、結果として 32 ビット符号なし整数が算出されます。その結果がターゲットの対応する値として格納されます。 この命令ではオーバーフローは起こりません。
vphaddubd 命令は、XOP ファミリの命令の一部です。 この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。 この命令に対するハードウェア サポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 11 をチェックします。 このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。
使用例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128i a, d;
int i;
for (i = 0; i < 4; i++) {
a.m128i_i8[i] = -128;
a.m128i_i8[i+4] = i-128;
a.m128i_i8[i+8] = 10*i;
a.m128i_i8[i+12] = 127;
}
// Note that this intrinsic treats negative values as unsigned
// So, e.g., -128 becomes +128
d = _mm_haddd_epu8(a);
for (i = 0; i < 4; i++) printf_s(" %u", d.m128i_u32[i]);
printf_s("\n");
}
参照
参照
その他の技術情報
Visual Studio 2010 SP1 用に追加された XOP 組み込み
履歴の変更
日付 |
履歴 |
理由 |
---|---|---|
2011 年 3 月 |
このコンテンツを追加。 |
SP1 機能変更 |