Parallel processing C++中的重叠内核执行与数据传输 虽然多流可以允许CUDA中同时进行数据传输和内核执行,但在C++ +AMP.

Parallel processing C++中的重叠内核执行与数据传输 虽然多流可以允许CUDA中同时进行数据传输和内核执行,但在C++ +AMP.,parallel-processing,c++-amp,Parallel Processing,C++ Amp,我想做的是从设备读取一个缓冲区,当内核将数据填充到另一个缓冲区时,我确实需要将数据返回到主机上,然后用两个缓冲区执行触发器 这个C++支持的用例是否存在CopyOffyAcyc函数,但是文档表明,抱歉,在这里反应慢。它似乎是C++的一个限制。希望有一个是取消,因为有很多情况下,你会希望工作在一个触发器数据缓冲,而阅读其他回来。

我想做的是从设备读取一个缓冲区,当内核将数据填充到另一个缓冲区时,我确实需要将数据返回到主机上,然后用两个缓冲区执行触发器


这个C++支持的用例是否存在CopyOffyAcyc函数,但是文档表明,抱歉,在这里反应慢。它似乎是C++的一个限制。希望有一个是取消,因为有很多情况下,你会希望工作在一个触发器数据缓冲,而阅读其他回来。