OpenCL上的FFT和Fast Conv,无需将数据复制到主机

OpenCL上的FFT和Fast Conv,无需将数据复制到主机,opencl,fft,Opencl,Fft,我想在GPU上执行FFT、FastConv和互相关,并将结果传递给其他OpenCL内核,而无需将结果复制到主机内存 你能不能告诉我一个FFT、FastConv和互相关的OpenCL实现,它们可以被称为内核,而无需将数据从GPU传输到主机?许多OpenCL供应商(如苹果、AMD、NVIDIA)都有包含内核源代码的FFT样本。您可以使用这些来处理设备上已经存在的缓冲区,并在设备上留下结果。有关建议或查找工具、库或喜爱的非现场资源的问题与堆栈溢出无关。

我想在GPU上执行FFT、FastConv和互相关,并将结果传递给其他OpenCL内核,而无需将结果复制到主机内存


你能不能告诉我一个FFT、FastConv和互相关的OpenCL实现,它们可以被称为内核,而无需将数据从GPU传输到主机?

许多OpenCL供应商(如苹果、AMD、NVIDIA)都有包含内核源代码的FFT样本。您可以使用这些来处理设备上已经存在的缓冲区,并在设备上留下结果。

有关建议或查找工具、库或喜爱的非现场资源的问题与堆栈溢出无关。