内核内的CUDA并行性_Cuda_Gpu - Fatal编程技术网

内核内的CUDA并行性

cuda

内核内的CUDA并行性,cuda,gpu,Cuda,Gpu,在CUDA中，它是如何管理GPU内核中的顺序代码的如果我在for循环中有一个内核，它是以顺序模式管理还是存在逻辑并行性顺序代码仍将按顺序计算，唯一的变化是所有线程将并行计算此代码让我们假设以下简单内核（corde写在这里，未测试）： \uuuuu全局\uuuuu无效内核（int*数组，int N） { if（螺纹IDX.x

在CUDA中，它是如何管理GPU内核中的顺序代码的

如果我在for循环中有一个内核，它是以顺序模式管理还是存在逻辑并行性

顺序代码仍将按顺序计算，唯一的变化是所有线程将并行计算此代码

让我们假设以下简单内核（corde写在这里，未测试）：

\uuuuu全局\uuuuu无效内核（int*数组，int N）
{
if（螺纹IDX.x__global__ void kernel(int *array, int N)
{
  if (threadIdx.x < N)
  {
    // complete for loop is computed parallel for different threads
    for (int i=0; i<1000; i++)
    {
      // every single thread perfomes this statement 1000 times
      array[threadIdx.x] += i;
    }
  }
}