Caching 有人知道NVIDIA开普勒GPU二级缓存结构的细节吗（映射功能、替换策略、关联性）？_Caching_Gpu

Caching 有人知道NVIDIA开普勒GPU二级缓存结构的细节吗（映射功能、替换策略、关联性）？

caching

Caching 有人知道NVIDIA开普勒GPU二级缓存结构的细节吗（映射功能、替换策略、关联性）？,caching,gpu,Caching,Gpu,我需要有关NVIDIA开普勒GPU二级缓存的详细信息。我知道缓存的大小（例如GT740M GPU上的512KB）和块大小（32B）。我试图通过一个示例内核捕获关联性、替换策略，以及更重要的映射函数（从全局地址到缓存线），并通过nvprof profiler分析读取命中率。我意识到映射不是模运算。是否有任何技巧可以找出给定全局地址映射到的缓存线？有人能帮我吗？正如@Dmitri Budnikov所说，缓存信息是不公开的一些研究人员正在研究这个问题，并给我们一些关于GPU体系结构的内存层次结构的见

我需要有关NVIDIA开普勒GPU二级缓存的详细信息。我知道缓存的大小（例如GT740M GPU上的512KB）和块大小（32B）。我试图通过一个示例内核捕获关联性、替换策略，以及更重要的映射函数（从全局地址到缓存线），并通过nvprof profiler分析读取命中率。我意识到映射不是模运算。是否有任何技巧可以找出给定全局地址映射到的缓存线？有人能帮我吗？

正如@Dmitri Budnikov所说，缓存信息是不公开的

一些研究人员正在研究这个问题，并给我们一些关于GPU体系结构的内存层次结构的见解

他们对二级缓存的研究结果总结如下：

二级缓存的替换策略不是LRU

二级缓存线大小为32字节

数据映射是复杂的，不是传统的位定义

费米、开普勒和麦克斯韦体系结构上有一种从DRAM到二级数据缓存的硬件级预取机制

他们制定的基准可以找到