在支持CUDA的示例设备中,内存层次结构的测量延迟值是多少?

在支持CUDA的示例设备中,内存层次结构的测量延迟值是多少?,cuda,benchmarking,latency,Cuda,Benchmarking,Latency,尽管这个问题和我的类似,但对于不同的类型,仍然没有发布任何延迟值。我希望能对他们的方法进行实际测量和解释,并对他们的方法进行推理。任何支持CUDA的离散NVidia卡都是理想的选择 需要衡量的事项: 登记册 共享内存 持续缓存命中 设备存储器 全局存储器 几乎是CUDA GPU的金标准基准测试示例。它通过使用特斯拉C1060/GTX 285“GT200”级GPU,通过非常彻底的微基准测试,公开了您感兴趣的大部分信息。几乎是CUDA GPU的金标准基准测试示例。想回答您的意见吗?这正是我想要的。

尽管这个问题和我的类似,但对于不同的类型,仍然没有发布任何延迟值。我希望能对他们的方法进行实际测量和解释,并对他们的方法进行推理。任何支持CUDA的离散NVidia卡都是理想的选择

需要衡量的事项:

  • 登记册

  • 共享内存

  • 持续缓存命中

  • 设备存储器

  • 全局存储器


  • 几乎是CUDA GPU的金标准基准测试示例。它通过使用特斯拉C1060/GTX 285“GT200”级GPU,通过非常彻底的微基准测试,公开了您感兴趣的大部分信息。

    几乎是CUDA GPU的金标准基准测试示例。想回答您的意见吗?这正是我想要的。