OpenCL与OpenMP在处理LBM问题时的性能差异有多大?

OpenCL与OpenMP在处理LBM问题时的性能差异有多大?,opencl,gpu,openmp,Opencl,Gpu,Openmp,我想为格子玻尔兹曼方法(LBM)或正常的Navier-Stokes CFD找到一个合适的GPU加速包 CUDA依赖于设备,这已经超出了我的视野 根据研究,OpenCL在进行CFD时的速度大约是OpenMP的3倍 但在LBM上没有可比性 OpenCL的代码编写难度是前者的2倍 我现在正在考虑OpenCL和OpenMP,请告诉我这两个版本在LBM问题上的性能差异有多大?我已经在OpenCL中实现了LBM,请参阅我的。通过在各种GPU和CPU上测试我的代码,并将其与其他多CPU实现的性能进行比较,我可

我想为格子玻尔兹曼方法(LBM)或正常的Navier-Stokes CFD找到一个合适的GPU加速包

CUDA依赖于设备,这已经超出了我的视野

根据研究,OpenCL在进行CFD时的速度大约是OpenMP的3倍

但在LBM上没有可比性

OpenCL的代码编写难度是前者的2倍


我现在正在考虑OpenCL和OpenMP,请告诉我这两个版本在LBM问题上的性能差异有多大?

我已经在OpenCL中实现了LBM,请参阅我的。通过在各种GPU和CPU上测试我的代码,并将其与其他多CPU实现的性能进行比较,我可以说1个GPU上的LBM大约与2000个CPU核上的LBM一样快。由于CPU上的LBM效率对于所有CPU代码来说都非常低,因此性能上的好处确实是巨大的(谢谢你的论文。这个问题对我来说很有趣,但可能太宽泛了。OpenMP卸载远没有OpenCL成熟。这是一个宽泛的说法。不过,我希望你的问题不会很快结束。很高兴最近看到越来越多关于OpenMP卸载的问题。我读了这篇论文。我认为你得出了错误的结论。这篇论文将骑士角上的OpenMP与Nvidia GPU上的OpenCL和CUDA进行了比较。这是苹果和橙子的比较。因此,OpenMP在不同硬件上的速度较慢这一事实并没有太大意义。骑士角的表现很差。骑士角的登陆是一个很大的改进,但令人遗憾的是,英特尔似乎正在放弃至强Phi。