Gpu AMD波前大小与银行冲突

Gpu AMD波前大小与银行冲突,gpu,opencl,bank-conflict,amd-gcn,Gpu,Opencl,Bank Conflict,Amd Gcn,GCN体系结构的波前大小为64,但本地内存只有32个存储组 如果所有线程都需要写入,那么如何避免冲突?显然,64个线程中只有32个可以在不引起冲突的情况下写入,我错过了什么 ds_permute_b32和ds_bpermute_b32是如何导致银行冲突的(显然是这样的),以及在同一波前的线程之间传递数据时如何避免冲突

GCN体系结构的波前大小为64,但本地内存只有32个存储组

  • 如果所有线程都需要写入,那么如何避免冲突?显然,64个线程中只有32个可以在不引起冲突的情况下写入,我错过了什么
  • ds_permute_b32
    ds_bpermute_b32
    是如何导致银行冲突的(显然是这样的),以及在同一波前的线程之间传递数据时如何避免冲突