CUDA-用于PCI-E的GB/s与用于GPU的内存时钟速度的Gbps_Cuda_Gpu_Bandwidth_Pci E

CUDA-用于PCI-E的GB/s与用于GPU的内存时钟速度的Gbps

cuda

CUDA-用于PCI-E的GB/s与用于GPU的内存时钟速度的Gbps,cuda,gpu,bandwidth,pci-e,Cuda,Gpu,Bandwidth,Pci E,我对PCI-E 3.0的速度感到惊讶：~16 GB/s（千兆字节/秒），而最高的gamma GPU内存时钟速度（Titan X列出了~10 Gbps，即千兆比特/秒）所以我们有 PCI-E 3.0 16 GB/s Titan X ~1 GB/s 因此，问题是：为什么会有如此巨大的差异？他们经常说，关于CUDA，PCI-E是利用GPU电源的最大障碍，但似乎恰恰相反：PCI-E可以处理比GPU内存大得多的负载（甚至PCI-E也有~8 GB/s）我的推理有缺陷吗？泰坦X的价格是每

我对PCI-E 3.0的速度感到惊讶：~16 GB/s（千兆字节/秒），而最高的gamma GPU内存时钟速度（Titan X列出了~10 Gbps，即千兆比特/秒）

所以我们有

PCI-E 3.0    16 GB/s
Titan X      ~1 GB/s

因此，问题是：为什么会有如此巨大的差异？他们经常说，关于CUDA，PCI-E是利用GPU电源的最大障碍，但似乎恰恰相反：PCI-E可以处理比GPU内存大得多的负载（甚至PCI-E也有~8 GB/s）

我的推理有缺陷吗？

泰坦X的价格是每针。对于384位宽的内存接口，这相当于480 GB/秒的总理论峰值内存带宽。对于内存和PCIe，实际可实现的值约为理论峰值带宽的80%。

问题明确，无理由投票（未给出任何结果）。谢谢。你的意思是“显然是离题的问题”。我已经投票决定结束这场辩论——这显然是关于硬件的，而且这是完全错误的，而且是荒谬的。我认为超级用户并不适合，因为它主要是关于CUDA的概念，不管怎样，我想解释一下为什么你认为这是荒谬的？如果我不先得到它，我就搞不懂了，因为它是每针的。对于384位宽的内存接口，这相当于480 GB/秒的总理论内存带宽。实际上，对于PCIe和内存而言，可实现的值约为80%。这是一个硬件规格问题，仅此而已，这就是为什么它不适合解释它而不仅仅是向下表决。384位pci-e将消耗大量电力。当然会。这可能是它不存在的原因之一。