如何评估CUDA GPU的相对性能?
我如何估计我没有的卡(即新卡)的cuda性能 例如,我发现一个不完整的Cuda示例,作者写道,在他的GF 8600 GT上需要0,7秒。但在我的Quadro上需要1,7秒 我的问题是:我用来填补空白的代码是错误的还是GF 8600的速度真的是原来的两倍? 内核内存有限,但我的卡有更高的内存带宽。我不知道从中得出什么结论如何评估CUDA GPU的相对性能?,cuda,gpu,gpgpu,nvidia,Cuda,Gpu,Gpgpu,Nvidia,我如何估计我没有的卡(即新卡)的cuda性能 例如,我发现一个不完整的Cuda示例,作者写道,在他的GF 8600 GT上需要0,7秒。但在我的Quadro上需要1,7秒 我的问题是:我用来填补空白的代码是错误的还是GF 8600的速度真的是原来的两倍? 内核内存有限,但我的卡有更高的内存带宽。我不知道从中得出什么结论 Name Quadro FX 580 GeForce 8600 GT CUDA Cores 32
Name Quadro FX 580 GeForce 8600 GT
CUDA Cores 32 32
Core clock (MHz) 450 540
Memory clock (MHz) 400 700
Memory BW (GB/s) 25.6 22.4
Shader Clock (MHz) ???? 1180
只是想为您提供一些可能是错误源的指针。首先,使用cudaEvents来计时代码,而不是cuda事件探查器,因为cudaEvents更准确。其次,请检查作者正在测量什么;他只是在谈论计算时间,还是在考虑将数据传输到GPU和从GPU传输数据的时间。你测量的是同一时间吗
其次,cuda体系结构正在快速变化。例如,对于使用cc 1.x的卡,建议使用共享内存以获得更好的性能;但是,对于使用cc 2.x的卡,每个多处理器都有一级缓存,这使得全局内存访问非常快。因此,您可能还想比较这两种卡的体系结构及其计算能力 根据我的经验,这两个GPU之间的性能应该非常相似。可能是硬件或软件配置的差异导致了性能差距。专用GPGPU卡可以显示出比同时用于输出视频信号的gpu更高的性能(尤其是在Windows Aero或Compiz运行的情况下)。还有,时间是如何测量的?总的来说,发布一些代码和更详细的PC配置可能会有所帮助,但如果不执行测试/评测,就很难在脑海中进行准确的估计。