CUDA-更多SM或更高的时钟频率?

CUDA-更多SM或更高的时钟频率?,cuda,nvidia,nsight,Cuda,Nvidia,Nsight,当CUDA内核速度执行至关重要时,什么更重要?核心的频率或SMs的数量 我可以在Quadro K5000和Gtx 670之间选择,但我无法决定。在这两种情况下,内存似乎足够了,但quadro有更多的SMs,而Gtx有更高的时钟速率(我想这个值是每个内核的)。取决于您尝试执行的内容。您的程序会使用Quadro的所有核心吗?如果没有,Gtx将更快。如果是这样的话,那么Gtx需要不止一个网格,你应该进行计算,但是Quadro可能会更快 取决于您试图执行的操作。您的程序会使用Quadro的所有核心吗?如

当CUDA内核速度执行至关重要时,什么更重要?核心的频率或SMs的数量


我可以在Quadro K5000和Gtx 670之间选择,但我无法决定。在这两种情况下,内存似乎足够了,但quadro有更多的SMs,而Gtx有更高的时钟速率(我想这个值是每个内核的)。

取决于您尝试执行的内容。您的程序会使用Quadro的所有核心吗?如果没有,Gtx将更快。如果是这样的话,那么Gtx需要不止一个网格,你应该进行计算,但是Quadro可能会更快

取决于您试图执行的操作。您的程序会使用Quadro的所有核心吗?如果没有,Gtx将更快。如果是这样的话,那么Gtx需要不止一个网格,你应该进行计算,但是Quadro可能会更快

Quadro K5000和GTX670均基于相同的GK104硅。在GTX470上,Quadro有8条SMs处于活动状态,而不是7条。GTX670以915Mhz的频率运行,而Quadro以706Mhz的频率运行,因此GTX670的总体吞吐量更好。Quadro的带宽为172GB/s,而GTX670的带宽为192GB/s,因此GTX670的带宽也更好

如果决定完全基于速度,请使用GTX670。如果预算允许,您可能还想考虑GTX780或TITAN。


选择哪个GPU卡以及选择原因的问题在的第11章中介绍。

Quadro K5000和GTX670均基于相同的GK104硅。在GTX470上,Quadro有8条SMs处于活动状态,而不是7条。GTX670以915Mhz的频率运行,而Quadro以706Mhz的频率运行,因此GTX670的总体吞吐量更好。Quadro的带宽为172GB/s,而GTX670的带宽为192GB/s,因此GTX670的带宽也更好

如果决定完全基于速度,请使用GTX670。如果预算允许,您可能还想考虑GTX780或TITAN。


有关选择哪种GPU卡以及选择原因的问题,请参见的第11章。

您好,Evans,谢谢。我有点傻,那么“gtx需要不止一个网格”是什么意思呢?我以为网格和块只是abstractions@DavidKernin每个卡每个内核调用有一个块的限制,每个块有一个线程的限制。网格是执行内核的一组块。例如,我的卡(gtx 560)每个块的线程数限制为1024个,每个网格的线程数限制为65535个。如果我需要超过65535x1024个线程,我将需要制作多个内核callHi Evans,谢谢。我有点傻,那么“gtx需要不止一个网格”是什么意思呢?我以为网格和块只是abstractions@DavidKernin每个卡每个内核调用有一个块的限制,每个块有一个线程的限制。网格是执行内核的一组块。例如,我的卡(gtx 560)每个块的线程数限制为1024个,每个网格的线程数限制为65535个。如果我需要超过65535x1024个线程,我将需要进行多个内核调用