Sorting 推力:在threadblock中排序

Sorting 推力:在threadblock中排序,sorting,cuda,thrust,Sorting,Cuda,Thrust,我正在调度一个大约有5k块的内核。在某个时候,我们需要在每个threadblock中对数组进行排序。如果可能的话,我们希望使用一个类似于推力的库。 从文档中我了解到,如何以推力执行排序取决于指定的执行策略。但是,我不明白是否可以使用执行\u策略指定要使用当前块的线程进行排序。有人能向我解释或提示执行策略的良好文档,并告诉我我打算做的事情是否可行吗?结果表明,执行策略基本上是一种桥接设计模式,它使用模板专门化而不是继承来选择算法的适当实现,同时公开稳定的面向库用户的接口,避免虚拟功能的开销/必要性

我正在调度一个大约有5k块的内核。在某个时候,我们需要在每个threadblock中对数组进行排序。如果可能的话,我们希望使用一个类似于推力的库。
从文档中我了解到,如何以推力执行排序取决于指定的
执行策略
。但是,我不明白是否可以使用
执行\u策略
指定要使用当前块的线程进行排序。有人能向我解释或提示执行策略的良好文档,并告诉我我打算做的事情是否可行吗?

结果表明,执行策略基本上是一种桥接设计模式,它使用模板专门化而不是继承来选择算法的适当实现,同时公开稳定的面向库用户的接口,避免虚拟功能的开销/必要性。谢谢你的精彩视频


至于在threadblock中实际实现的排序,是正确的。根本没有实现(目前?),我在源代码中找不到任何东西。

没有。CUB有一个块范围排序,但如果是这样的话,这是一个小问题。您能告诉我执行策略的用途和使用方法吗?找不到任何关于这个的支持文档。嗨,谢谢。我也发现了这一点,但并没有得出结论。但非常感谢你的提示和努力。它的执行策略要播放视频,您可能需要单击视频窗口的中心以显示控件,然后单击左下角的播放按钮