Opencl 如何在实践中使用NDrange?
我读过文件和书籍 (也包括这些职位:;) 关于使用NDrange进行数据分区的执行模型和理论Opencl 如何在实践中使用NDrange?,opencl,Opencl,我读过文件和书籍 (也包括这些职位:;) 关于使用NDrange进行数据分区的执行模型和理论 我是否基于硬件构建工作项和工作组?如果是,如何查询设备上有多少工作项和工作组可用?如何划分工作项和工作组以实现良好绩效,是否有良好的实践 我想知道它们在实际中是如何工作和相互作用的,对于一维数组和像图像一样的二维数组的计算 良好的分区需要了解GPU硬件。例如,让我们看看像Radeon 6970这样的AMD卡。核心总数为1536个。它们封装在24个SIMD单元中。每个单元由16个具有VLIW4体系结构的流