调用CUDA ECC2C时创建的块/线程数和占用的内存数
我在程序中使用了cuFFT函数。我用的是特斯拉k20卡。我的信号大小是16384调用CUDA ECC2C时创建的块/线程数和占用的内存数,cuda,nvidia,Cuda,Nvidia,我在程序中使用了cuFFT函数。我用的是特斯拉k20卡。我的信号大小是16384 调用cufftExecC2C时,将创建多少块和线程,以及GPU上将消耗多少内存?如@harrism所示,您可以使用来发现执行参数 nvprof --print-gpu-trace <your-executable> 这些调用将返回建议转换类型和大小的估计内存使用大小 请参阅中的CUDA 5.5 RC文档(例如,对于linux CUDA 5.5 RC安装): /usr/local/cuda/doc/pd
调用cufftExecC2C时,将创建多少块和线程,以及GPU上将消耗多少内存?如@harrism所示,您可以使用来发现执行参数
nvprof --print-gpu-trace <your-executable>
这些调用将返回建议转换类型和大小的估计内存使用大小
请参阅中的CUDA 5.5 RC文档(例如,对于linux CUDA 5.5 RC安装):
/usr/local/cuda/doc/pdf/cuft_Library.pdf
特别是第3.4节“CUFFT估计工作区大小”
如果您制定了计划,则可以使用以下CUDA 5.5 CUFFT API
cufftGetSize…
类似于估算调用的调用,获得更准确的规模估算。有关详细信息,请参阅上述文档的第3.5节。标题询问内存,正文询问执行参数。您想知道哪一个?对于执行参数,您可以自己回答nvprof——打印gpu跟踪
@talonmies我想了解内存和执行参数。。
cufftEstimate1d(…)
cufftEstimate2d(…)
cufftEstimate3d(…)
cufftEstimateMany(…)