为CUDA开发“上”;“便宜”;GPU

为CUDA开发“上”;“便宜”;GPU,cuda,gpu,gpgpu,Cuda,Gpu,Gpgpu,我在我的桌面上用CUDA开发算法,以后应该在服务器上运行 使用最新的低端卡(如compute capability 2.1)获得所有良好的调试和分析功能,然后将代码放在带有高端卡的服务器上(使用相同的cc)可以吗?我只需要调整线/网格大小,还是它会改变一切™. 示例:我将在a上开发,服务器将使用a。存在一些问题,例如内存带宽不同(根据您的链接,Quadro上为25.6 GiB/s,Tesla上为148 GiB/s),或者SMs数量不同(驱动程序可能会在SMs上以不同方式分配块)。然而,在大多

我在我的桌面上用CUDA开发算法,以后应该在服务器上运行

使用最新的低端卡(如compute capability 2.1)获得所有良好的调试和分析功能,然后将代码放在带有高端卡的服务器上(使用相同的cc)可以吗?我只需要调整线/网格大小,还是它会改变一切™.


示例:我将在a上开发,服务器将使用a。

存在一些问题,例如内存带宽不同(根据您的链接,Quadro上为25.6 GiB/s,Tesla上为148 GiB/s),或者SMs数量不同(驱动程序可能会在SMs上以不同方式分配块)。然而,在大多数情况下,这种微小的差异并不重要

如果服务器安装了多个GPU,则需要更改代码以在多个GPU上运行,以充分利用服务器的功能。虽然相同的代码可以在一张卡上正常运行


如果服务器上只有一张卡;一般的经验法则是,当驱动程序在SMs之间自动分配负载时,您不需要更改任何代码行来利用更强的GPU的能力

只要内核调用和内核本身是可伸缩的,就没有问题

看看这个问题: