Matrix 如何使用CUDA计算大型矩阵的二维FFT?

Matrix 如何使用CUDA计算大型矩阵的二维FFT?,matrix,cuda,cufft,Matrix,Cuda,Cufft,现在我有一个大的16K*16K矩阵,全局内存不足。如何计算矩阵的二维FFT?也许使用统一内存的超额订阅对cuFFT有效 您还可以分别对行和列进行FFT,并将数据从主机内存移动到主机内存 你需要完整的结果矩阵吗?CPU和GPU上有多少内存?输入/输出值是否复杂?您需要什么样的精度(16位足够吗)?计算时间是否关键?您还想处理更大的矩阵吗?很可能您不能。有一些核心外的fft算法。我不知道任何GPU实现。当然,cufftYou中没有人能够在3GB GPU(使用CUFFT)上进行floatR2C或C2

现在我有一个大的16K*16K矩阵,全局内存不足。如何计算矩阵的二维FFT?

也许使用统一内存的超额订阅对cuFFT有效

您还可以分别对行和列进行FFT,并将数据从主机内存移动到主机内存


你需要完整的结果矩阵吗?CPU和GPU上有多少内存?输入/输出值是否复杂?您需要什么样的精度(16位足够吗)?计算时间是否关键?您还想处理更大的矩阵吗?

很可能您不能。有一些核心外的fft算法。我不知道任何GPU实现。当然,cufftYou中没有人能够在3GB GPU(使用CUFFT)上进行
float
R2C或C2R这种大小的就地转换。这是一个框架。我可以在2GB GPU上进行15Kx15K的转换。