ARM处理器中霓虹灯双值点积的计算
我需要做很多向量计算。因此,我认为应该使用霓虹灯是明智的。问题是这个函数依赖于double。这给了我两个选择,重新编写整个代码,使其与浮点一起工作,或者使用double作为输入,double作为输出创建一个函数,并使用float进行计算 我需要进行以下计算:ARM处理器中霓虹灯双值点积的计算,arm,neon,beagleboard,Arm,Neon,Beagleboard,我需要做很多向量计算。因此,我认为应该使用霓虹灯是明智的。问题是这个函数依赖于double。这给了我两个选择,重新编写整个代码,使其与浮点一起工作,或者使用double作为输入,double作为输出创建一个函数,并使用float进行计算 我需要进行以下计算: dotproduct = A[0]*B[0] + A[1]*B[1] + A[2]*B[2] 阵列的尺寸标注为双倍。如何使用NEON Intrinsic进行此计算?NEON不支持双精度运算。您必须重写函数以对单精度值进行操作,或者使用标量
dotproduct = A[0]*B[0] + A[1]*B[1] + A[2]*B[2]
阵列的尺寸标注为双倍。如何使用NEON Intrinsic进行此计算?NEON不支持双精度运算。您必须重写函数以对单精度值进行操作,或者使用标量双精度VFP指令代替NEON。NEON不支持双精度操作。您必须重写函数以操作单精度值,或者使用标量双精度VFP指令而不是NEON。假设您追求的是性能而不是精度,最好在任何地方使用单精度,这样可以使用neon并降低内存空间/带宽成本。假设您追求的是性能而不是精度,最好在任何地方使用单精度,这样可以使用neon并降低内存空间/带宽成本。