为CUDA开发“上”；“便宜”；GPU_Cuda_Gpu_Gpgpu

为CUDA开发“上”；“便宜”；GPU

cuda

为CUDA开发“上”；“便宜”；GPU,cuda,gpu,gpgpu,Cuda,Gpu,Gpgpu,我在我的桌面上用CUDA开发算法，以后应该在服务器上运行使用最新的低端卡（如compute capability 2.1）获得所有良好的调试和分析功能，然后将代码放在带有高端卡的服务器上（使用相同的cc）可以吗？我只需要调整线/网格大小，还是它会改变一切™. 示例：我将在a上开发，服务器将使用a。存在一些问题，例如内存带宽不同（根据您的链接，Quadro上为25.6 GiB/s，Tesla上为148 GiB/s），或者SMs数量不同（驱动程序可能会在SMs上以不同方式分配块）。然而，在大多

我在我的桌面上用CUDA开发算法，以后应该在服务器上运行

使用最新的低端卡（如compute capability 2.1）获得所有良好的调试和分析功能，然后将代码放在带有高端卡的服务器上（使用相同的cc）可以吗？我只需要调整线/网格大小，还是它会改变一切™.

示例：我将在a上开发，服务器将使用a。

存在一些问题，例如内存带宽不同（根据您的链接，Quadro上为25.6 GiB/s，Tesla上为148 GiB/s），或者SMs数量不同（驱动程序可能会在SMs上以不同方式分配块）。然而，在大多数情况下，这种微小的差异并不重要

如果服务器安装了多个GPU，则需要更改代码以在多个GPU上运行，以充分利用服务器的功能。虽然相同的代码可以在一张卡上正常运行

如果服务器上只有一张卡；一般的经验法则是，当驱动程序在SMs之间自动分配负载时，您不需要更改任何代码行来利用更强的GPU的能力

只要内核调用和内核本身是可伸缩的，就没有问题

看看这个问题：