Parallel processing 金属螺纹组的执行顺序

Parallel processing 金属螺纹组的执行顺序,parallel-processing,gpu,metal,Parallel Processing,Gpu,Metal,我试图用金属来实现一个硬件加速的图像过滤器(任何感兴趣的人都可以进行接缝雕刻)。一个步骤是逐行运行代码,每行的计算取决于上行的计算。但是,每行的计算可以通过像素进行并行化 一种方法是为每一行调度一次内核,但我确信有更好的方法,因为这会导致大量开销 有什么方法可以告诉Metal执行线程组的顺序吗?行N,像素M的计算是否仅取决于行N-1,像素M?或者它们是否依赖于第N-1行中的其他像素?Metal2具有光栅顺序组@谢谢,但我已经查阅了有关光栅订单组的文档。它们需要具有恒定索引的注释。行N,像素M的计

我试图用金属来实现一个硬件加速的图像过滤器(任何感兴趣的人都可以进行接缝雕刻)。一个步骤是逐行运行代码,每行的计算取决于上行的计算。但是,每行的计算可以通过像素进行并行化

一种方法是为每一行调度一次内核,但我确信有更好的方法,因为这会导致大量开销


有什么方法可以告诉Metal执行线程组的顺序吗?

行N,像素M的计算是否仅取决于行N-1,像素M?或者它们是否依赖于第N-1行中的其他像素?Metal2具有光栅顺序组@谢谢,但我已经查阅了有关光栅订单组的文档。它们需要具有恒定索引的注释。行N,像素M的计算是否仅依赖于行N-1,像素M?或者它们是否依赖于第N-1行中的其他像素?Metal2具有光栅顺序组@谢谢,但我已经查阅了有关光栅订单组的文档。它们需要具有常量索引的注释。