C++ 比较SSE Intrinsics中的符号位

C++ 比较SSE Intrinsics中的符号位,c++,sse,intrinsics,C++,Sse,Intrinsics,如何使用SSE intrinsics创建一个掩码,它指示两个压缩浮点(uu m128)的符号是否相同,例如,如果比较a和b,其中a是[1.0-1.0 0 0.0 2.0],b是[1.0 1.0 1.0],我们将得到的所需掩码是[true-false-true]。这里有一个解决方案: const __m128i MASK = _mm_set1_epi32(0xffffffff); __m128 a = _mm_setr_ps(1,-1,0,2); __m128 b = _mm_setr_ps(1

如何使用SSE intrinsics创建一个掩码,它指示两个压缩浮点(uu m128)的符号是否相同,例如,如果比较a和b,其中a是[1.0-1.0 0 0.0 2.0],b是[1.0 1.0 1.0],我们将得到的所需掩码是[true-false-true]。

这里有一个解决方案:

const __m128i MASK = _mm_set1_epi32(0xffffffff);

__m128 a = _mm_setr_ps(1,-1,0,2);
__m128 b = _mm_setr_ps(1,1,1,1);

__m128  f = _mm_xor_ps(a,b);
__m128i i = _mm_castps_si128(f);

i = _mm_srai_epi32(i,31);
i = _mm_xor_si128(i,MASK);

f = _mm_castsi128_ps(i);

//  i = (0xffffffff, 0, 0xffffffff, 0xffffffff)
//  f = (0xffffffff, 0, 0xffffffff, 0xffffffff)
在这个代码段中,
i
f
将具有相同的位掩码。我假设您希望它出现在
m128
类型中,因此我添加了
f=\u mm\u castsi128\u ps(I)
将其从
\uuuu m128i
转换回

请注意,此代码对零的符号很敏感。因此
0.0
-0.0
将影响结果


解释:

代码的工作方式如下所示:

f = _mm_xor_ps(a,b);       //  xor the sign bits (well all the bits actually)

i = _mm_castps_si128(f);   //  Convert it to an integer. There's no instruction here.

i = _mm_srai_epi32(i,31);  //  Arithmetic shift that sign bit into all the bits.

i = _mm_xor_si128(i,MASK); //  Invert all the bits

f = _mm_castsi128_ps(i);   //  Convert back. Again, there's no instruction here.

请看一下
\u mm\u movemask\u ps
指令,它从4个浮点数中提取最高有效位(即符号位)。看

例如,如果有[1.0-1.0 0.0 2.0],则movemask_ps将返回4,或二进制的0100。因此,如果您为每个向量获取movemask_ps并比较结果(可能是按位而不是异或),那么这将指示所有符号是否相同

a = [1.0 -1.0 0.0 2.0]
b = [1.0 1.0 1.0 1.0]
movemask_ps a = 4
movemask_ps b = 0
NOT (a XOR b) = 0xB, or binary 1011

因此,除了第二个向量元素外,符号是相同的。

@Mystical,您如何使用此函数在浮点上执行符号函数?@Royi作为单独的问题更好。