ARM处理器中霓虹灯双值点积的计算_Arm_Neon_Beagleboard

ARM处理器中霓虹灯双值点积的计算

arm

ARM处理器中霓虹灯双值点积的计算,arm,neon,beagleboard,Arm,Neon,Beagleboard,我需要做很多向量计算。因此，我认为应该使用霓虹灯是明智的。问题是这个函数依赖于double。这给了我两个选择，重新编写整个代码，使其与浮点一起工作，或者使用double作为输入，double作为输出创建一个函数，并使用float进行计算我需要进行以下计算： dotproduct = A[0]*B[0] + A[1]*B[1] + A[2]*B[2] 阵列的尺寸标注为双倍。如何使用NEON Intrinsic进行此计算？NEON不支持双精度运算。您必须重写函数以对单精度值进行操作，或者使用标量

我需要做很多向量计算。因此，我认为应该使用霓虹灯是明智的。问题是这个函数依赖于double。这给了我两个选择，重新编写整个代码，使其与浮点一起工作，或者使用double作为输入，double作为输出创建一个函数，并使用float进行计算

我需要进行以下计算：

dotproduct = A[0]*B[0] + A[1]*B[1] + A[2]*B[2]

阵列的尺寸标注为双倍。如何使用NEON Intrinsic进行此计算？

NEON不支持双精度运算。您必须重写函数以对单精度值进行操作，或者使用标量双精度VFP指令代替NEON。

NEON不支持双精度操作。您必须重写函数以操作单精度值，或者使用标量双精度VFP指令而不是NEON。

假设您追求的是性能而不是精度，最好在任何地方使用单精度，这样可以使用neon并降低内存空间/带宽成本。假设您追求的是性能而不是精度，最好在任何地方使用单精度，这样可以使用neon并降低内存空间/带宽成本。