内核内的CUDA并行性
在CUDA中,它是如何管理GPU内核中的顺序代码的内核内的CUDA并行性,cuda,gpu,Cuda,Gpu,在CUDA中,它是如何管理GPU内核中的顺序代码的 如果我在for循环中有一个内核,它是以顺序模式管理还是存在逻辑并行性 顺序代码仍将按顺序计算,唯一的变化是所有线程将并行计算此代码 让我们假设以下简单内核(corde写在这里,未测试): \uuuuu全局\uuuuu无效内核(int*数组,int N) { if(螺纹IDX.x
如果我在for循环中有一个内核,它是以顺序模式管理还是存在逻辑并行性 顺序代码仍将按顺序计算,唯一的变化是所有线程将并行计算此代码 让我们假设以下简单内核(corde写在这里,未测试):
\uuuuu全局\uuuuu无效内核(int*数组,int N)
{
if(螺纹IDX.x__global__ void kernel(int *array, int N)
{
if (threadIdx.x < N)
{
// complete for loop is computed parallel for different threads
for (int i=0; i<1000; i++)
{
// every single thread perfomes this statement 1000 times
array[threadIdx.x] += i;
}
}
}