Concurrency 在同一个多处理器上并发、唯一的内核?

Concurrency 在同一个多处理器上并发、唯一的内核?,concurrency,cuda,kepler,cuda-streams,Concurrency,Cuda,Kepler,Cuda Streams,在开普勒3.5GPU的同一个流式多处理器上,使用流是否可能有多个唯一的内核?也就是说,在具有15条SMs的开普勒GPU上,在compute capability 3.5设备上同时运行30个大小的内核是可能的 这些设备支持每个GPU最多32个并发内核和2048个对等多处理器线程。对于每个多处理器64k寄存器,如果每个线程的寄存器占用空间小于16个,并且每个块的共享内存小于24kb,则1024个线程的两个块可以并发运行 您可以在CUDA编程指南的附录中找到所有这些硬件描述。在compute capa

在开普勒3.5GPU的同一个流式多处理器上,使用流是否可能有多个唯一的内核?也就是说,在具有15条SMs的开普勒GPU上,在compute capability 3.5设备上同时运行30个大小的内核是可能的

这些设备支持每个GPU最多32个并发内核和2048个对等多处理器线程。对于每个多处理器64k寄存器,如果每个线程的寄存器占用空间小于16个,并且每个块的共享内存小于24kb,则1024个线程的两个块可以并发运行


您可以在CUDA编程指南的附录中找到所有这些硬件描述。

在compute capability 3.5设备上,这是可能的

这些设备支持每个GPU最多32个并发内核和2048个对等多处理器线程。对于每个多处理器64k寄存器,如果每个线程的寄存器占用空间小于16个,并且每个块的共享内存小于24kb,则1024个线程的两个块可以并发运行


您可以在CUDA编程指南的附录中找到所有这些硬件描述。

哪个开普勒GPU?计算能力3.0和3.5对内核资源和并发性有不同的限制。我对你的问题不是很清楚。“即”部分似乎与之前提出的问题无关。不清楚您是否对标准内核并发感兴趣,或者是否对在特定的多处理器上运行不同的内核感兴趣。在后一种情况下,考虑到CUDA程序员屏蔽了块调度。@Talonmies抱歉,Compute 3.5。K40最新的GPU。@Jackolanten在同一个多处理器上同时运行不同的内核。但是在您选择的特定多处理器上,或者在任何可用的多处理器上?哪个开普勒GPU?计算能力3.0和3.5对内核资源和并发性有不同的限制。我对你的问题不是很清楚。“即”部分似乎与之前提出的问题无关。不清楚您是否对标准内核并发感兴趣,或者是否对在特定的多处理器上运行不同的内核感兴趣。在后一种情况下,考虑到CUDA程序员屏蔽了块调度。@Talonmies抱歉,Compute 3.5。K40最新的GPU。@Jackolanten在同一个多处理器上同时运行不同的内核。但是在您选择的特定多处理器上,或者在任何可用的多处理器上?哪个开普勒GPU?计算能力3.0和3.5对内核资源和并发性有不同的限制。我对你的问题不是很清楚。“即”部分似乎与之前提出的问题无关。不清楚您是否对标准内核并发感兴趣,或者是否对在特定的多处理器上运行不同的内核感兴趣。在后一种情况下,考虑到CUDA程序员屏蔽了块调度。@Talonmies抱歉,Compute 3.5。K40最新的GPU。@Jackolanten在同一个多处理器上同时运行不同的内核。但在您选择的特定多处理器上,或在任何可用的多处理器上?幻灯片19也可能有兴趣。幻灯片19也可能有兴趣。幻灯片19也可能有兴趣。