Memory cuda&x27;内存绑定';vs';延迟限制';vs';带宽限制';vs';计算界';

Memory cuda&x27;内存绑定';vs';延迟限制';vs';带宽限制';vs';计算界';,memory,cuda,bandwidth,Memory,Cuda,Bandwidth,在许多在线资源中,可以找到“内存”、“带宽”、“延迟”绑定内核的不同用法。在我看来,作者有时会使用他们自己对这些术语的定义,我认为如果有人能够明确区分这些术语,那将是非常有益的 据我理解: 带宽受限内核在访问全局内存方面接近设备的物理限制。例如,应用程序在M2090设备上使用177GB/s中的170GB/s 延迟受限内核的主要暂停原因是内存获取。因此,我们没有使全局内存总线饱和,但仍然必须等待数据进入内核 计算绑定内核是一种计算控制内核时间的内核,前提是向内核提供内存没有问题,并且算法和延迟有很

在许多在线资源中,可以找到“内存”、“带宽”、“延迟”绑定内核的不同用法。在我看来,作者有时会使用他们自己对这些术语的定义,我认为如果有人能够明确区分这些术语,那将是非常有益的

据我理解: 带宽受限内核在访问全局内存方面接近设备的物理限制。例如,应用程序在M2090设备上使用177GB/s中的170GB/s

延迟受限内核的主要暂停原因是内存获取。因此,我们没有使全局内存总线饱和,但仍然必须等待数据进入内核

计算绑定内核是一种计算控制内核时间的内核,前提是向内核提供内存没有问题,并且算法和延迟有很好的重叠

如果这些都是正确的,那么“内存绑定”内核是什么呢?是否存在歧义?如果是,我们是否应将对话限制在上述三个术语

谢谢

“内存绑定”内核是什么

内存限制是指代码受内存访问限制的一般情况,即它包括延迟限制的代码和带宽限制的代码。你几乎正确地定义了所有其他术语

是否存在歧义?如果是,我们是否应将对话限制在上述三个术语


我不认为有太多的含糊不清之处(无论如何,你已经清楚地划分了4个术语中的3个),你也不会在这样一个问题/答案中给世界强加秩序。

谢谢你的澄清。我的意思是“mem-bound”的模糊性。欢呼,难道没有另一个经常发生的情况:受pci-e传输速率的限制吗?