Memory 什么';这两者之间的区别是什么;gld/st“吞吐量”;及;dram“读/写”吞吐量;韵律学?

Memory 什么';这两者之间的区别是什么;gld/st“吞吐量”;及;dram“读/写”吞吐量;韵律学?,memory,cuda,metrics,throughput,Memory,Cuda,Metrics,Throughput,在CUDA visual profiler版本5中,我知道“gld/st_请求的_吞吐量”是应用程序请求的内存吞吐量。然而,当我试图找到硬件的实际吞吐量时,我感到困惑,因为有两对指标似乎是合格的,它们是“gld/st_吞吐量”和“dram_读/写_吞吐量”。哪一对实际上是硬件吞吐量?另一个用作什么?gld/st_吞吐量包括由一级缓存和二级缓存服务的事务。而dram\u读/写吞吐量是二级和设备内存之间的吞吐量。因此,每个全局内存访问都会计入gld/st\u吞吐量,但只有错过一级和二级缓存的请求才会

在CUDA visual profiler版本5中,我知道“gld/st_请求的_吞吐量”是应用程序请求的内存吞吐量。然而,当我试图找到硬件的实际吞吐量时,我感到困惑,因为有两对指标似乎是合格的,它们是“gld/st_吞吐量”和“dram_读/写_吞吐量”。哪一对实际上是硬件吞吐量?另一个用作什么?

gld/st_吞吐量
包括由一级缓存和二级缓存服务的事务。而
dram\u读/写吞吐量
是二级和设备内存之间的吞吐量。因此,每个全局内存访问都会计入
gld/st\u吞吐量
,但只有错过一级和二级缓存的请求才会计入
dram\u读/写吞吐量


我还没有找到一个很好的计数器概览。希望NVIDIA提供…

有一个指标参考。我不想开始讨论它是否好,我相信它可能会更好。所有对全局内存的访问都要经过L2,包括从CPU主机到CPU主机的拷贝@斯图洛:谢谢。我的回答在那一点上措词不当。“会修好的。”罗杰Dahl@stuhlo:谢谢你们,我拿到了!