OpenCL与OpenMP在处理LBM问题时的性能差异有多大？_Opencl_Gpu_Openmp - Fatal编程技术网

OpenCL与OpenMP在处理LBM问题时的性能差异有多大？

opencl

OpenCL与OpenMP在处理LBM问题时的性能差异有多大？,opencl,gpu,openmp,Opencl,Gpu,Openmp,我想为格子玻尔兹曼方法（LBM）或正常的Navier-Stokes CFD找到一个合适的GPU加速包 CUDA依赖于设备，这已经超出了我的视野根据研究，OpenCL在进行CFD时的速度大约是OpenMP的3倍但在LBM上没有可比性 OpenCL的代码编写难度是前者的2倍我现在正在考虑OpenCL和OpenMP，请告诉我这两个版本在LBM问题上的性能差异有多大？我已经在OpenCL中实现了LBM，请参阅我的。通过在各种GPU和CPU上测试我的代码，并将其与其他多CPU实现的性能进行比较，我可

我想为格子玻尔兹曼方法（LBM）或正常的Navier-Stokes CFD找到一个合适的GPU加速包

CUDA依赖于设备，这已经超出了我的视野

根据研究，OpenCL在进行CFD时的速度大约是OpenMP的3倍

但在LBM上没有可比性

OpenCL的代码编写难度是前者的2倍

我现在正在考虑OpenCL和OpenMP，请告诉我这两个版本在LBM问题上的性能差异有多大？

我已经在OpenCL中实现了LBM，请参阅我的。通过在各种GPU和CPU上测试我的代码，并将其与其他多CPU实现的性能进行比较，我可以说1个GPU上的LBM大约与2000个CPU核上的LBM一样快。由于CPU上的LBM效率对于所有CPU代码来说都非常低，因此性能上的好处确实是巨大的（谢谢你的论文。这个问题对我来说很有趣，但可能太宽泛了。OpenMP卸载远没有OpenCL成熟。这是一个宽泛的说法。不过，我希望你的问题不会很快结束。很高兴最近看到越来越多关于OpenMP卸载的问题。我读了这篇论文。我认为你得出了错误的结论。这篇论文将骑士角上的OpenMP与Nvidia GPU上的OpenCL和CUDA进行了比较。这是苹果和橙子的比较。因此，OpenMP在不同硬件上的速度较慢这一事实并没有太大意义。骑士角的表现很差。骑士角的登陆是一个很大的改进，但令人遗憾的是，英特尔似乎正在放弃至强Phi。

[adobe]相关文章推荐

随机文章推荐