Cuda 使用多个GPU';在单个推力函数调用上的

Cuda 使用多个GPU';在单个推力函数调用上的,cuda,thrust,Cuda,Thrust,推力功能可以使用多个GPU来实现吗 计算,如果有的话? 我已经写了这个推力代码,它只需要一个 GPU。(特斯拉C2050)但我还有另外三张特斯拉C2050卡 到我想用来计算的机器上 我知道在一台机器上连接多个GPU时,我可以运行一个 每个GPU并行的CUDA内核,即设备0上的内核0,设备0上的内核1 设备1等。。 但在我的情况下,我想在一个推力上使用所有的4个GPU 函数调用,比如说推力::排序。这可能吗?还没有。但这是推力的路线图,你可以在谷歌集团表达你的愿望。 在这个问题上,杜安·梅里

推力功能可以使用多个GPU来实现吗 计算,如果有的话? 我已经写了这个推力代码,它只需要一个 GPU。(特斯拉C2050)但我还有另外三张特斯拉C2050卡 到我想用来计算的机器上

我知道在一台机器上连接多个GPU时,我可以运行一个 每个GPU并行的CUDA内核,即设备0上的内核0,设备0上的内核1 设备1等。。 但在我的情况下,我想在一个推力上使用所有的4个GPU
函数调用,比如说推力::排序。这可能吗?

还没有。但这是推力的路线图,你可以在谷歌集团表达你的愿望。

在这个问题上,杜安·梅里尔(Duane Merrill)也认为这是最快速的排序实现(基数排序-b40c)的创建者