次の方法で共有


_mm_haddd_epu16

更新 : 2011 年 3 月

Visual Studio 2010 SP1 が必要です。

Microsoft 固有の仕様 →

XOP 命令 vphaddwd を生成して、ソースに対して符号なし整数水平加算を実行します。

__m128i _mm_haddd_epu16 (
   __m128i src
); 

パラメーター

  • [入力] src
    8 個の 16 ビット符号なし整数を含む 128 ビットのパラメーター。

戻り値

4 個の 32 ビット符号なし整数を含む 128 ビットの結果 r。

r[i] := src[2*i] + src[2*i+1];

必要条件

組み込み

アーキテクチャ

_mm_haddd_epu16

XOP

ヘッダー ファイル <intrin.h>

解説

src の 16 ビット符号なし整数値の各ペア (偶数と奇数のインデックスを持つ 4 個のペア) が加算され、結果として 32 ビット符号なし整数が算出されます。その結果がターゲットの対応する値として格納されます。 この命令ではオーバーフローは起こりません。

vphaddwd 命令は、XOP ファミリの命令の一部です。 この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。 この命令に対するハードウェア サポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 11 をチェックします。 このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。

使用例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128i a, d;
    int i;
    for (i = 0; i < 2; i++) {
        a.m128i_i16[4*i] = -128;
        a.m128i_i16[4*i+1] = i-128;
        a.m128i_i16[4*i+2] = 10*i;
        a.m128i_i16[4*i+3] = 127;
    }
    // Note that this intrinsic treats negative values as unsigned
    // So, e.g., -1 becomes 65535
    d = _mm_haddd_epu16(a);
    for (i = 0; i < 4; i++) printf_s(" %u", d.m128i_u32[i]);
    printf_s("\n");
}
  

参照

参照

__cpuid, __cpuidex

その他の技術情報

_mm_haddw_epu8

_mm_haddq_epu16

_mm_haddd_epu8

_mm_haddd_epi16

Visual Studio 2010 SP1 用に追加された XOP 組み込み

履歴の変更

日付

履歴

理由

2011 年 3 月

このコンテンツを追加。

SP1 機能変更