Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/cplusplus/130.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C++ 使用SIMD查找表_C++_Sse_Simd - Fatal编程技术网

C++ 使用SIMD查找表

C++ 使用SIMD查找表,c++,sse,simd,C++,Sse,Simd,我有一个大像素的处理功能,我目前正试图优化使用内在函数 作为SSE新手,我不知道如何处理代码中涉及查找表的部分 基本上,我试图用下面的香草C++代码:< /P> //outside loop const float LUT_RATIO = 1000.0F; //in loop float v = ... //input value v = myLookupTable[static_cast<int>(v * LUT_RATIO)]; 编辑:ildjarn提出了一个要求我澄清的观

我有一个大像素的处理功能,我目前正试图优化使用内在函数

作为SSE新手,我不知道如何处理代码中涉及查找表的部分

基本上,我试图用下面的香草C++代码:< /P>
 //outside loop
const float LUT_RATIO = 1000.0F;

//in loop
float v = ... //input value
v = myLookupTable[static_cast<int>(v * LUT_RATIO)];

编辑:ildjarn提出了一个要求我澄清的观点。我并不是要实现查找表代码的加速,我只是想避免将寄存器存储回专门用于查找的浮点,由于此部分夹在理论上可以从SSE获益的其他两部分之间。

如果您可以等到明年,则Intel的Haswell CPU将具有AVX2,其中包括收集负载的指令。这使您能够在一条指令中执行8个并行LUT查找(例如,请参见
VGATHERDPS
)。除此之外,除非您的LUT非常小(例如16个元素),否则您的运气不好,在这种情况下,您可以使用
PSHUFB

您相信谁可以改进
myLookupTable[静态\u cast(v)*LUT\u比率]
?这里没有执行计算,为什么SSE适用?@ildjarn我很确定我不能改进这部分本身,但我希望改进函数的其他部分,并避免在
\u m128
float[4]之间来回移动的惩罚
我还必须将此代码矢量化。不幸的是,我的LUT大10000个元素。即使我要等待一个新的处理器,也需要数年的时间才能合法地指定Haswell作为最低cpu。:)谢谢你提供的信息。好的-如果你能近似你的LUT,例如,用多项式,那么你仍然可以用SSE赢,否则我担心你会被标量代码卡住。标量代码就是这样。从某种程度上说,这是个好消息,我可以不再担心这个部分,而去研究那些可能被证明更具优化性的部分。为什么这样的工作不起作用:_mm_storeu_si128((_m128i*)LutIndex,_mm_cvtps_epi32(_mm_mul ps(LUT_比率,floatData));www=_mm_set_ps(myLUT[LutIndex[3]、myLUT[LutIndex[2]、myLUT[LutIndex[1]、myLUT[LutIndex[0])@德拉齐克:这是可行的,但是在
\u mm\u set\u ps
内在的背后隐藏着大量的标量代码和多个内存访问。
//outside loop
const __m128 LUT_RATIO = _mm_set1_ps(1000.0F);

//in loop
__m128 v = _mm_set_ps(v1, v2, v3, v4); //input values
__m128i vI = _mm_cvtps_epi32(_mm_mul_ps(v, LUT_RATIO)); //multiply and convert to integers
v = ??? // how to get vI indices of myLookupTable?