Image processing opencl中的共享内存与纹理内存
我正在用Opencl编写逐行扫描代码。我正在使用本地内存中的read_imageui()API读取像素 就像下面的代码: 根据我的理解,当我们使用这个API读取像素时,我们是从纹理内存中读取的。我怀疑在共享内存中首先使用像素是否能帮助我提高速度,因为纹理内存已经起到缓存的作用,并提供对数据的快速访问Image processing opencl中的共享内存与纹理内存,image-processing,opencl,Image Processing,Opencl,我正在用Opencl编写逐行扫描代码。我正在使用本地内存中的read_imageui()API读取像素 就像下面的代码: 根据我的理解,当我们使用这个API读取像素时,我们是从纹理内存中读取的。我怀疑在共享内存中首先使用像素是否能帮助我提高速度,因为纹理内存已经起到缓存的作用,并提供对数据的快速访问 有人能澄清我的疑问吗?总的来说,这是真的。然而,即使是从纹理缓存读取也可能比从共享本地内存读取慢,因此对于从相邻位置进行多次重叠读取的算法来说,使用共享本地内存仍然可以从某种程度上受益。但是,这会
有人能澄清我的疑问吗?总的来说,这是真的。然而,即使是从纹理缓存读取也可能比从共享本地内存读取慢,因此对于从相邻位置进行多次重叠读取的算法来说,使用共享本地内存仍然可以从某种程度上受益。但是,这会使内核更加复杂,因此在许多情况下(当然是在算法开发过程中),只能依赖缓存的纹理读取