Image processing 快速图像方块(int)图像-ARM neon intrinsics-iOS开发

Image processing 快速图像方块(int)图像-ARM neon intrinsics-iOS开发,image-processing,ios5,arm,simd,neon,Image Processing,Ios5,Arm,Simd,Neon,有人能告诉我一个快速的函数来计算整型图像中每个像素的平方吗。我需要它的iOS应用程序开发。我的工作直接在内存中的图像定义为 int *image_sqr_Baseaaddr = (int *) malloc(noOfPixels * sizeof(int)); for (int i=0; i<newNoOfPixels; i++) image_sqr_Baseaaddr[i] = (int) image_scaled_Baseaaddr[i] * (int) image_sca

有人能告诉我一个快速的函数来计算整型图像中每个像素的平方吗。我需要它的iOS应用程序开发。我的工作直接在内存中的图像定义为

int *image_sqr_Baseaaddr = (int *) malloc(noOfPixels * sizeof(int));

for (int i=0; i<newNoOfPixels; i++)
     image_sqr_Baseaaddr[i] = (int) image_scaled_Baseaaddr[i] * (int) image_scaled_Baseaaddr[i];
int*image\u sqr\u Baseaaddr=(int*)malloc(noOfPixels*sizeof(int));

对于(int i=0;i,这里有一个简单的NEON实现:

#include <arm_neon.h>

// ...

int i;

for (i = 0; i <= newNoOfPixels - 16; i += 16)           // SIMD loop
{
    uint8x16_t v = vld1q_u8(&image_scaled_Baseaaddr[i]);// load 16 x 8 bit pixels

    int16x8_t vl = (int16x8_t)vmovl_u8(vget_low_u8(v)); // unpack into 2 x 16 bit vectors
    int16x8_t vh = (int16x8_t)vmovl_u8(vget_high_u8(v));

    vl = vmulq_s16(vl, vl);                             // square them
    vh = vmulq_s16(vh, vh);

    int32x4_t vll = vmovl_s16(vget_low_s16(vl));        // unpack to 4 x 32 bit vectors
    int32x4_t vlh = vmovl_s16(vget_high_s16(vl));
    int32x4_t vhl = vmovl_s16(vget_low_s16(vh));
    int32x4_t vhh = vmovl_s16(vget_high_s16(vh));

    vst1q_s32(&image_sqr_Baseaaddr[i], vll);            // store 32 bit squared values
    vst1q_s32(&image_sqr_Baseaaddr[i + 4], vlh);
    vst1q_s32(&image_sqr_Baseaaddr[i + 8], vhl);
    vst1q_s32(&image_sqr_Baseaaddr[i + 12], vhh);
}
for ( ; i < newNoOfPixels; ++i)                         // scalar clean up loop
{
    int32_t p = (int32_t)image_scaled_Baseaaddr[i];
    image_sqr_Baseaaddr[i] = p * p;
}
#包括
// ...
int i;

对于(i=0;i),问题是我的输入“image_scaled_Baseaaddr”是一个无符号的char*图像,我需要输出“image_sqr_Baseaaddr”是一个int*图像。对于这种情况,需要对上述代码进行哪些更改?好的-我现在更新了代码,以便它读取8位像素值并将平方值存储到32位int数组中。