除了GPGPU和Radeon之外,是否有类似于推力(GPU的并行STL)的库? 是否有类似的推力库(GPU的并行STL,它可以使用OpenMP/TBB,C++ CUDA),但是对于GPGPU AMD RADEON(例如使用OpenCL而不是使用CUDA)? 所需标准STL算法(排序、合并、删除/复制IF、I/C++扫描等),在GPU中并行实现,在Win/*NIX(AMP不适合)中并行执行。该库将同时支持AMP和OpenCL作为后端

除了GPGPU和Radeon之外,是否有类似于推力(GPU的并行STL)的库? 是否有类似的推力库(GPU的并行STL,它可以使用OpenMP/TBB,C++ CUDA),但是对于GPGPU AMD RADEON(例如使用OpenCL而不是使用CUDA)? 所需标准STL算法(排序、合并、删除/复制IF、I/C++扫描等),在GPU中并行实现,在Win/*NIX(AMP不适合)中并行执行。该库将同时支持AMP和OpenCL作为后端,c++,stl,opencl,gpgpu,C++,Stl,Opencl,Gpgpu,但是为什么它只支持Win7/8(这是你的链接在文章中写的),如果它使用OpenCL(哪种跨平台),它不支持任何*nix操作系统?我不知道,我只知道它存在:)Bolt现在在Linux上工作请查看Boost.Compute:。@Kyle Lutz谢谢!与价格相同的CPU相比,GPGPU上的排序(稳定的_排序)快多少倍?例如,在价格相同的情况下,在推力(CUDA GPU的STL)中,推力::稳定_排序比CPU(Core i7)快5倍。位于SYCL之上,SYCL位于OpenCL之上,OpenCL在AMD

但是为什么它只支持Win7/8(这是你的链接在文章中写的),如果它使用OpenCL(哪种跨平台),它不支持任何*nix操作系统?我不知道,我只知道它存在:)Bolt现在在Linux上工作请查看Boost.Compute:。@Kyle Lutz谢谢!与价格相同的CPU相比,GPGPU上的排序(稳定的_排序)快多少倍?例如,在价格相同的情况下,在推力(CUDA GPU的STL)中,推力::稳定_排序比CPU(Core i7)快5倍。位于SYCL之上,SYCL位于OpenCL之上,OpenCL在AMD硬件上得到很好的支持。