并行FFT(使用CUDA)
在我的应用程序中,我需要变换图像的每一行,应用过滤器并将其变换回来 我希望能够使用GPU同时进行多次FFT。更准确地说,我使用的是英伟达的CUDA。现在,有一些考虑:并行FFT(使用CUDA),cuda,fft,Cuda,Fft,在我的应用程序中,我需要变换图像的每一行,应用过滤器并将其变换回来 我希望能够使用GPU同时进行多次FFT。更准确地说,我使用的是英伟达的CUDA。现在,有一些考虑: CUDA的FFT库,CUFFT只能从主机()进行调用 关于这个话题,罗伯特·科维拉说 “多个主机线程可以调用CUFT例程” 我相信并行执行所有这些FFT将提高性能,但是Robert评论道 “FFT操作的大小相当大,那么只需调用所示的cufft库例程,就可以获得很好的加速,并大致充分利用机器” 所以, 是这个吗?一次执行多个FFT