cuda可视档案器详细信息->;吞吐量

cuda可视档案器详细信息->;吞吐量,cuda,profiler,throughput,Cuda,Profiler,Throughput,在VisualProfiler(cuda toolkit 4.1)的详细信息选项卡下,有一个称为吞吐量的指标。这只对memcpy HtoD DtoH等有价值。有人确切知道它是什么吗? “帮助”搜索提供了许多不同的吞吐量(例如全局内存吞吐量和其他吞吐量),我无法确定该指标指的是哪里。吞吐量是数据传输速率,通常以GB/s为单位。对于HtoD和DtoH,这是主机和设备之间通过连接两者的PCI总线进行的数据传输。您还可以使用DtoD,在这种情况下,您的吞吐量应该显著提高,因为您不受PCI总线带宽的限制。

在VisualProfiler(cuda toolkit 4.1)的详细信息选项卡下,有一个称为吞吐量的指标。这只对memcpy HtoD DtoH等有价值。有人确切知道它是什么吗?
“帮助”搜索提供了许多不同的吞吐量(例如全局内存吞吐量和其他吞吐量),我无法确定该指标指的是哪里。

吞吐量是数据传输速率,通常以GB/s为单位。对于HtoD和DtoH,这是主机和设备之间通过连接两者的PCI总线进行的数据传输。您还可以使用DtoD,在这种情况下,您的吞吐量应该显著提高,因为您不受PCI总线带宽的限制。这是一个重要的指标,因为在主机和设备之间传输数据是CUDA上实现良好性能的最大瓶颈之一。尽可能在主机上使用固定(页面锁定)内存,可以提高主机设备吞吐量

您可以通过使用
nvvp
评测SDK附带的
bandwidthTest
示例来测试这一点