Parallel processing 将OpenMP规范与OpenCL/CUDA一起使用的可行性如何?

Parallel processing 将OpenMP规范与OpenCL/CUDA一起使用的可行性如何?,parallel-processing,cuda,opencl,gpu,openmp,Parallel Processing,Cuda,Opencl,Gpu,Openmp,我想在CPU和GPU/APU之间分配我的工作。CPU上的一半工作使用OpenMP(利用多核),另一半工作使用OpenCL(或CUDA)在GPU或APU上加速 我已经寻找了技术工作,但我所发现的只是两个模型性能的比较 这不仅是可行的,而且是普遍的 许多官方CUDA样本使用OpenMP。甚至还有一个。是的,您可以这样做,CUDA示例提供了一个示例代码,演示OpenMP和CUDA的协同工作。OpenCL也有类似的功能。您只需在此处搜索两个标记,就可以找到大量CUDA+OpenMP示例。例如,单击共享内

我想在CPU和GPU/APU之间分配我的工作。CPU上的一半工作使用OpenMP(利用多核),另一半工作使用OpenCL(或CUDA)在GPU或APU上加速


我已经寻找了技术工作,但我所发现的只是两个模型性能的比较

这不仅是可行的,而且是普遍的


许多官方CUDA样本使用OpenMP。甚至还有一个。

是的,您可以这样做,CUDA示例提供了一个示例代码,演示OpenMP和CUDA的协同工作。OpenCL也有类似的功能。您只需在此处搜索两个标记,就可以找到大量CUDA+OpenMP示例。例如,单击共享内核代码,您甚至可以使用(例如)Intel的OpenCL CPU驱动程序将OpenCL用于CPU部分。它将使用所有内核,但我不知道CPU内核编译器与OpenMP相比优化程度如何。@Dithermaster我的意思是使用OpenMP进一步划分CPU上的串行部分。。不共享并行内核。。但我理解你的答案,它可能适用于另一个问题,在这种情况下,基准点将是必须的