Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/templates/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
CUDA流需要更长的时间_Cuda - Fatal编程技术网

CUDA流需要更长的时间

CUDA流需要更长的时间,cuda,Cuda,流是否可能比普通CUDA程序花费更长的时间?保证流所操作的数据块是独立的,并且允许从设备端进行内核执行和数据传输之间的重叠 要观察流之间的叠加,您应该使用带有conckerneltrace选项的命令行探查器。您还可以将分析输出保存为.csv文件,并将其导入到Visual Profiler中。见英伟达论坛帖子 您是否正在运行探查器?探查器序列化所有调用。可能是@RogerDahl的副本我应该如何在linux上安装探查器?探查器应该包含在您必须安装的CUDA工具包中。如果您使用的是4.1工具包,如果

流是否可能比普通CUDA程序花费更长的时间?保证流所操作的数据块是独立的,并且允许从设备端进行内核执行和数据传输之间的重叠

要观察流之间的叠加,您应该使用带有
conckerneltrace
选项的命令行探查器。您还可以将分析输出保存为.csv文件,并将其导入到Visual Profiler中。见英伟达论坛帖子


您是否正在运行探查器?探查器序列化所有调用。可能是@RogerDahl的副本我应该如何在linux上安装探查器?探查器应该包含在您必须安装的CUDA工具包中。如果您使用的是4.1工具包,如果我没记错的话,它应该被称为“nvvp”。