OpenCL浮点精度管理

OpenCL浮点精度管理,opencl,gpu,gpuimage,Opencl,Gpu,Gpuimage,在实习期间,我正在尝试在GPU上并行化一个对象定位算法。但是OpenCL的最大浮点精度成了相当大的问题 参考算法一直使用双精度实现,特别是对于SVM分类器和描述符。Mine以单精度实现,导致误差。我检查了我的标准化错误,并在程序的几个点(10^-6)得到了我期望的结果 然而,在过程的分类步骤之后,这些错误变得更加重要 有没有办法用只支持单精度的GPU模拟双精度值? PS:我可以在我的GPU(Nvidia GTS450)上使用双精度,但该程序将在多个平台上进行测试,功耗要低得多,这可能意味着没有双

在实习期间,我正在尝试在GPU上并行化一个对象定位算法。但是OpenCL的最大浮点精度成了相当大的问题

参考算法一直使用双精度实现,特别是对于SVM分类器和描述符。Mine以单精度实现,导致误差。我检查了我的标准化错误,并在程序的几个点(10^-6)得到了我期望的结果

然而,在过程的分类步骤之后,这些错误变得更加重要

有没有办法用只支持单精度的GPU模拟双精度值?


PS:我可以在我的GPU(Nvidia GTS450)上使用双精度,但该程序将在多个平台上进行测试,功耗要低得多,这可能意味着没有双精度。

这可能会引起您的兴趣:

谢谢,我会研究它!