CUDA-用于PCI-E的GB/s与用于GPU的内存时钟速度的Gbps

CUDA-用于PCI-E的GB/s与用于GPU的内存时钟速度的Gbps,cuda,gpu,bandwidth,pci-e,Cuda,Gpu,Bandwidth,Pci E,我对PCI-E 3.0的速度感到惊讶:~16 GB/s(千兆字节/秒),而最高的gamma GPU内存时钟速度(Titan X列出了~10 Gbps,即千兆比特/秒) 所以我们有 PCI-E 3.0 16 GB/s Titan X ~1 GB/s 因此,问题是:为什么会有如此巨大的差异?他们经常说,关于CUDA,PCI-E是利用GPU电源的最大障碍,但似乎恰恰相反:PCI-E可以处理比GPU内存大得多的负载(甚至PCI-E也有~8 GB/s) 我的推理有缺陷吗?泰坦X的价格是每

我对PCI-E 3.0的速度感到惊讶:~16 GB/s(千兆字节/秒),而最高的gamma GPU内存时钟速度(Titan X列出了~10 Gbps,即千兆比特/秒)

所以我们有

PCI-E 3.0    16 GB/s
Titan X      ~1 GB/s
因此,问题是:为什么会有如此巨大的差异?他们经常说,关于CUDA,PCI-E是利用GPU电源的最大障碍,但似乎恰恰相反:PCI-E可以处理比GPU内存大得多的负载(甚至PCI-E也有~8 GB/s)


我的推理有缺陷吗?

泰坦X的价格是每针。对于384位宽的内存接口,这相当于480 GB/秒的总理论峰值内存带宽。对于内存和PCIe,实际可实现的值约为理论峰值带宽的80%。

问题明确,无理由投票(未给出任何结果)。谢谢。你的意思是“显然是离题的问题”。我已经投票决定结束这场辩论——这显然是关于硬件的,而且这是完全错误的,而且是荒谬的。我认为超级用户并不适合,因为它主要是关于CUDA的概念,不管怎样,我想解释一下为什么你认为这是荒谬的?如果我不先得到它,我就搞不懂了,因为它是每针的。对于384位宽的内存接口,这相当于480 GB/秒的总理论内存带宽。实际上,对于PCIe和内存而言,可实现的值约为80%。这是一个硬件规格问题,仅此而已,这就是为什么它不适合解释它而不仅仅是向下表决。384位pci-e将消耗大量电力。当然会。这可能是它不存在的原因之一。