Cuda 对GPU内存带宽的概念性理解
我对GPU内存带宽的概念有点困惑 根据它所说的GPU规格 峰值带宽为177.6gb/s 那么当人们提到带宽时,它指的是带宽吗Cuda 对GPU内存带宽的概念性理解,cuda,Cuda,我对GPU内存带宽的概念有点困惑 根据它所说的GPU规格 峰值带宽为177.6gb/s 那么当人们提到带宽时,它指的是带宽吗 单向通信的速度,如每秒可读取的字节数, 从设备 双向通信的速度,如每秒可读取和写入设备内存的字节数 无论我在哪里读到这一术语,我都看不到这一澄清带宽是在给定时间段内可以读取或写入的数据量 相同的总线用于读取和写入。在给定的时钟周期内,总线可用于读取或写入。总线上只有一组导线,因此不能同时写入或读取数据。理论上带宽是相同的,总读+写==总读==总写 但在实践中,如果您正
- 单向通信的速度,如每秒可读取的字节数, 从设备
- 双向通信的速度,如每秒可读取和写入设备内存的字节数
无论我在哪里读到这一术语,我都看不到这一澄清带宽是在给定时间段内可以读取或写入的数据量
相同的总线用于读取和写入。在给定的时钟周期内,总线可用于读取或写入。总线上只有一组导线,因此不能同时写入或读取数据。理论上带宽是相同的,总读+写==总读==总写 但在实践中,如果您正在向设备写入大量连续数据块,则传输效率要高得多,这是最常见的用法,也是系统优化的目的 编辑。图形卡的内部内存带宽(即卡上各种组件之间的内存路径)远高于进出计算机的带宽
它也要复杂得多,有不同类型的内存以不同的方式连接到不同的处理器,制造商会选择使其听起来最高的数字-除了比较来自同一GPU系列的非常相似的卡的不同型号外,这个数字实际上毫无意义。您还可以区分连续的数据流(在任一方向;通常称为带宽)以及往返通信实例(查找,通常称为延迟)。对于NVIDIA GPU,全局内存延迟通常约为400个周期(对于L1和L2未命中)。