内核内的CUDA并行性

内核内的CUDA并行性,cuda,gpu,Cuda,Gpu,在CUDA中,它是如何管理GPU内核中的顺序代码的 如果我在for循环中有一个内核,它是以顺序模式管理还是存在逻辑并行性 顺序代码仍将按顺序计算,唯一的变化是所有线程将并行计算此代码 让我们假设以下简单内核(corde写在这里,未测试): \uuuuu全局\uuuuu无效内核(int*数组,int N) { if(螺纹IDX.x

在CUDA中,它是如何管理GPU内核中的顺序代码的


如果我在for循环中有一个内核,它是以顺序模式管理还是存在逻辑并行性

顺序代码仍将按顺序计算,唯一的变化是所有线程将并行计算此代码

让我们假设以下简单内核(corde写在这里,未测试):

\uuuuu全局\uuuuu无效内核(int*数组,int N)
{
if(螺纹IDX.x__global__ void kernel(int *array, int N)
{
  if (threadIdx.x < N)
  {
    // complete for loop is computed parallel for different threads
    for (int i=0; i<1000; i++)
    {
      // every single thread perfomes this statement 1000 times
      array[threadIdx.x] += i;
    }
  }
}