调用CUDA ECC2C时创建的块/线程数和占用的内存数

调用CUDA ECC2C时创建的块/线程数和占用的内存数,cuda,nvidia,Cuda,Nvidia,我在程序中使用了cuFFT函数。我用的是特斯拉k20卡。我的信号大小是16384 调用cufftExecC2C时,将创建多少块和线程,以及GPU上将消耗多少内存?如@harrism所示,您可以使用来发现执行参数 nvprof --print-gpu-trace <your-executable> 这些调用将返回建议转换类型和大小的估计内存使用大小 请参阅中的CUDA 5.5 RC文档(例如,对于linux CUDA 5.5 RC安装): /usr/local/cuda/doc/pd

我在程序中使用了cuFFT函数。我用的是特斯拉k20卡。我的信号大小是16384


调用cufftExecC2C时,将创建多少块和线程,以及GPU上将消耗多少内存?

如@harrism所示,您可以使用来发现执行参数

nvprof --print-gpu-trace <your-executable>
这些调用将返回建议转换类型和大小的估计内存使用大小

请参阅中的CUDA 5.5 RC文档(例如,对于linux CUDA 5.5 RC安装):

/usr/local/cuda/doc/pdf/cuft_Library.pdf

特别是第3.4节“CUFFT估计工作区大小”


如果您制定了计划,则可以使用以下CUDA 5.5 CUFFT API
cufftGetSize…
类似于估算调用的调用,获得更准确的规模估算。有关详细信息,请参阅上述文档的第3.5节。

标题询问内存,正文询问执行参数。您想知道哪一个?对于执行参数,您可以自己回答
nvprof——打印gpu跟踪
@talonmies我想了解内存和执行参数。。
cufftEstimate1d(…)
cufftEstimate2d(…)
cufftEstimate3d(…)
cufftEstimateMany(…)