如何评估CUDA GPU的相对性能?

如何评估CUDA GPU的相对性能?,cuda,gpu,gpgpu,nvidia,Cuda,Gpu,Gpgpu,Nvidia,我如何估计我没有的卡(即新卡)的cuda性能 例如,我发现一个不完整的Cuda示例,作者写道,在他的GF 8600 GT上需要0,7秒。但在我的Quadro上需要1,7秒 我的问题是:我用来填补空白的代码是错误的还是GF 8600的速度真的是原来的两倍? 内核内存有限,但我的卡有更高的内存带宽。我不知道从中得出什么结论 Name Quadro FX 580 GeForce 8600 GT CUDA Cores 32

我如何估计我没有的卡(即新卡)的cuda性能

例如,我发现一个不完整的Cuda示例,作者写道,在他的GF 8600 GT上需要0,7秒。但在我的Quadro上需要1,7秒

我的问题是:我用来填补空白的代码是错误的还是GF 8600的速度真的是原来的两倍?

内核内存有限,但我的卡有更高的内存带宽。我不知道从中得出什么结论

Name               Quadro FX 580     GeForce 8600 GT 
CUDA Cores                    32                  32
Core clock (MHz)             450                 540   
Memory clock (MHz)           400                 700
Memory BW (GB/s)              25.6                22.4  
Shader Clock (MHz)          ????                1180  

只是想为您提供一些可能是错误源的指针。首先,使用cudaEvents来计时代码,而不是cuda事件探查器,因为cudaEvents更准确。其次,请检查作者正在测量什么;他只是在谈论计算时间,还是在考虑将数据传输到GPU和从GPU传输数据的时间。你测量的是同一时间吗


其次,cuda体系结构正在快速变化。例如,对于使用cc 1.x的卡,建议使用共享内存以获得更好的性能;但是,对于使用cc 2.x的卡,每个多处理器都有一级缓存,这使得全局内存访问非常快。因此,您可能还想比较这两种卡的体系结构及其计算能力

根据我的经验,这两个GPU之间的性能应该非常相似。可能是硬件或软件配置的差异导致了性能差距。专用GPGPU卡可以显示出比同时用于输出视频信号的gpu更高的性能(尤其是在Windows Aero或Compiz运行的情况下)。还有,时间是如何测量的?总的来说,发布一些代码和更详细的PC配置可能会有所帮助,但如果不执行测试/评测,就很难在脑海中进行准确的估计。