Caching 有人知道NVIDIA开普勒GPU二级缓存结构的细节吗(映射功能、替换策略、关联性)?

Caching 有人知道NVIDIA开普勒GPU二级缓存结构的细节吗(映射功能、替换策略、关联性)?,caching,gpu,Caching,Gpu,我需要有关NVIDIA开普勒GPU二级缓存的详细信息。我知道缓存的大小(例如GT740M GPU上的512KB)和块大小(32B)。我试图通过一个示例内核捕获关联性、替换策略,以及更重要的映射函数(从全局地址到缓存线),并通过nvprof profiler分析读取命中率。我意识到映射不是模运算。是否有任何技巧可以找出给定全局地址映射到的缓存线?有人能帮我吗?正如@Dmitri Budnikov所说,缓存信息是不公开的 一些研究人员正在研究这个问题,并给我们一些关于GPU体系结构的内存层次结构的见

我需要有关NVIDIA开普勒GPU二级缓存的详细信息。我知道缓存的大小(例如GT740M GPU上的512KB)和块大小(32B)。我试图通过一个示例内核捕获关联性、替换策略,以及更重要的映射函数(从全局地址到缓存线),并通过nvprof profiler分析读取命中率。我意识到映射不是模运算。是否有任何技巧可以找出给定全局地址映射到的缓存线?有人能帮我吗?

正如@Dmitri Budnikov所说,缓存信息是不公开的

一些研究人员正在研究这个问题,并给我们一些关于GPU体系结构的内存层次结构的见解

他们对二级缓存的研究结果总结如下:

  • 二级缓存的替换策略不是LRU
  • 二级缓存线大小为32字节
  • 数据映射是复杂的,不是传统的位定义
  • 费米、开普勒和麦克斯韦体系结构上有一种从DRAM到二级数据缓存的硬件级预取机制
  • 他们制定的基准可以找到