Kernel GPU中的内存绑定内核和计算绑定内核

Kernel GPU中的内存绑定内核和计算绑定内核,kernel,gpu,nvidia,Kernel,Gpu,Nvidia,什么是“GPU中的内存绑定内核和计算绑定内核” 这与GPU的性能有关吗 非正式地说,如果内核的大部分时间都花在执行内存指令上,那么内核是内存受限的。相反,如果大多数操作是ALU-FPU指令,那么内核是计算绑定的。GPU具有较高的内存和计算带宽,可适用于这两种类型。这些术语用于分类,并指示哪些优化技术可以显著提高应用程序的性能 对于每个类别的工作负载,都有不同的优化提示 例如,对于内存受限的工作负载: 利用共享内存 内存访问合并 记忆露营 对于计算绑定的工作负载: 减少分支发散 ALU-FP

什么是“GPU中的内存绑定内核和计算绑定内核”


这与GPU的性能有关吗

非正式地说,如果内核的大部分时间都花在执行内存指令上,那么内核是内存受限的。相反,如果大多数操作是ALU-FPU指令,那么内核是计算绑定的。GPU具有较高的内存和计算带宽,可适用于这两种类型。这些术语用于分类,并指示哪些优化技术可以显著提高应用程序的性能

对于每个类别的工作负载,都有不同的优化提示

例如,对于内存受限的工作负载:

  • 利用共享内存
  • 内存访问合并
  • 记忆露营
对于计算绑定的工作负载:

  • 减少分支发散
  • ALU-FPU与FPGA之间的交织计算 SFU
  • 为开发ILP提供足够的独立说明