ARM霓虹灯:用于减法的VPADAL
我正在使用ARM霓虹灯:用于减法的VPADAL,arm,simd,neon,Arm,Simd,Neon,我正在使用VPADAL.U32指令来大大提高我的加法代码速度。然而,我需要用累加和进位进行减法运算(正是我得到的加法) 一厢情愿还是真的可能 根据我所能收集到的,我需要减少我的第二个操作数,然后不是它的位。。。执行VPADAL,然后对1进行位测试,并从结果进位中减去1(得到0或-1——我的累加) 我在什么地方遗漏了一种神秘的技巧吗?你可以使用VPADDL对加数进行两两相加,并将宽度增加一倍,然后使用VQSUB从总数中减去这一项
VPADAL.U32
指令来大大提高我的加法代码速度。然而,我需要用累加和进位进行减法运算(正是我得到的加法)
一厢情愿还是真的可能
根据我所能收集到的,我需要减少我的第二个操作数,然后不是它的位。。。执行VPADAL
,然后对1进行位测试,并从结果进位中减去1(得到0或-1——我的累加)
我在什么地方遗漏了一种神秘的技巧吗?你可以使用VPADDL对加数进行两两相加,并将宽度增加一倍,然后使用VQSUB从总数中减去这一项