如何更改CUDA内核的数量以计算效率和可扩展性?

如何更改CUDA内核的数量以计算效率和可扩展性?,cuda,Cuda,我是CUDA的新手,我想请您帮助我了解一下,除了用每个块的线程数和执行的线程块数修改内核外,是否可以更改内核的数量来计算程序的效率和可伸缩性。也就是说,如果假设效率和可扩展性是基于处理器的数量,并且我从我的费米GPU中的512个内核开始,那么我如何从512个内核更改为256个、128个等内核,以便在给定的数据负载下获得不同的加速比?? 提前谢谢 CUDA不支持这种类型的硬件粒度,也无法按照您所要求的方式控制内核。CUDA没有提供直接的方法来实现这一点。类似的问题,我相信还有其他类似的问题。使用谨

我是CUDA的新手,我想请您帮助我了解一下,除了用每个块的线程数和执行的线程块数修改内核外,是否可以更改内核的数量来计算程序的效率和可伸缩性。也就是说,如果假设效率和可扩展性是基于处理器的数量,并且我从我的费米GPU中的512个内核开始,那么我如何从512个内核更改为256个、128个等内核,以便在给定的数据负载下获得不同的加速比??
提前谢谢

CUDA不支持这种类型的硬件粒度,也无法按照您所要求的方式控制内核。

CUDA没有提供直接的方法来实现这一点。类似的问题,我相信还有其他类似的问题。使用谨慎的块编码技术可能占用单个SM,但这不会使您获得CUDA内核级别的粒度。您想要减少内核的数量,这是否意味着您想要停用部分硬件?还是你指的是logics cuda线程?谢谢你的回答,对我很有用!!!我的意思是想停用部分硬件,但我明白了。那么,有没有其他方法来计算具有固定数量内核的程序的效率和可伸缩性呢?谢谢!!!因此,如果我不能操纵内核来实现这一点,有没有一些方法可以计算具有固定数量内核的程序的效率和可伸缩性?我的意思是,要在固定数量的核上改变加速比?@00ivan00:在固定数量的核上改变并行工作的数量,而不是在固定数量的并行工作上改变核的数量。