Cuda K20c中的Hyper-Q分为8组?

Cuda K20c中的Hyper-Q分为8组?,cuda,Cuda,我有一个开普勒K20c和13个SMX,我正在做一些生物信息学研究。为了更好地理解Hyper-Q,我从Nvidia下载了这个示例:但我得到了不同的结果 他们的结果 我的成绩 该示例只是在每个流中启动两个不同的内核,以显示费米和开普勒的不同特性。但我的结果看起来像是介于开普勒和费米之间! 看起来很奇怪!有谁能告诉我为什么会这样吗?多亏了迈克尔。问题是由CUDA_设备_MAX_连接引起的,只需使用以下命令将此变量设置为32: export CUDA_DEVICE_MAX_CONNECTIONS=3

我有一个开普勒K20c和13个SMX,我正在做一些生物信息学研究。为了更好地理解Hyper-Q,我从Nvidia下载了这个示例:但我得到了不同的结果

他们的结果

我的成绩

该示例只是在每个流中启动两个不同的内核,以显示费米和开普勒的不同特性。但我的结果看起来像是介于开普勒和费米之间!
看起来很奇怪!有谁能告诉我为什么会这样吗?

多亏了迈克尔。问题是由CUDA_设备_MAX_连接引起的,只需使用以下命令将此变量设置为32:

export CUDA_DEVICE_MAX_CONNECTIONS=32 

这将解决此问题

您使用什么命令行来调用示例?您是在windows还是linux上运行?@RobertCrovella我刚刚使用了示例附带的makefile,刚刚从我的Bash中调用了./simpleHyperQ。@RobertCrovella顺便说一句,我自己的代码也有这种问题,看起来我的机器只能有8的并发性。仅供将来参考,从5.5版本开始,这一点记录在编程指南()的附录I中。