Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/c/68.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
CUDA上内核执行的计时_C_Parallel Processing_Gpu_Cuda - Fatal编程技术网

CUDA上内核执行的计时

CUDA上内核执行的计时,c,parallel-processing,gpu,cuda,C,Parallel Processing,Gpu,Cuda,我使用了CUDAC最佳实践中的代码来实现执行计时器。然而,他们的行为有些奇怪,我不知道这是异常还是正常。每次运行CUDA应用程序时,我都会得到不同的读数 这些读数是否与设计有关,或者这是我应该期待的 除了Windows 7,我的机器上没有运行任何图形密集型应用程序。这取决于差异有多大。您可以看到由内核调度器引起的异常。调度程序可能会为内核函数提供一些额外的时间片(因为图形API调用涉及错误检查),这会显示更多的执行时间。如果差异非常大,我会说检查你的代码,但如果它非常低,以毫秒为单位,我就不担心

我使用了CUDAC最佳实践中的代码来实现执行计时器。然而,他们的行为有些奇怪,我不知道这是异常还是正常。每次运行CUDA应用程序时,我都会得到不同的读数

这些读数是否与设计有关,或者这是我应该期待的


除了Windows 7,我的机器上没有运行任何图形密集型应用程序。

这取决于差异有多大。您可以看到由内核调度器引起的异常。调度程序可能会为内核函数提供一些额外的时间片(因为图形API调用涉及错误检查),这会显示更多的执行时间。如果差异非常大,我会说检查你的代码,但如果它非常低,以毫秒为单位,我就不担心了+-10毫秒是大多数操作系统(可能包括windows)中时间限制的常用时间。
另外,Aero有点密集,因此可能会增加您所看到的差异。

这取决于差异有多大。您可以看到由内核调度器引起的异常。调度程序可能会为内核函数提供一些额外的时间片(因为图形API调用涉及错误检查),这会显示更多的执行时间。如果差异非常大,我会说检查你的代码,但如果它非常低,以毫秒为单位,我就不担心了+-10毫秒是大多数操作系统(可能包括windows)中时间限制的常用时间。 此外,空气动力学是一种密集型,因此可能会增加你所看到的差异

我使用了CUDAC最佳实践中的代码来实现执行计时器

是的,根据我的经验,这不是一个“最佳实践”

我建议您在设备端代码和CUDA运行时API调用中使用探查器(我认为,对于您自己的主机端代码来说,它也可以运行得比较好)。设置和确定要使用哪些选项需要一些麻烦,但这是值得的

我使用了CUDAC最佳实践中的代码来实现执行计时器

是的,根据我的经验,这不是一个“最佳实践”


我建议您在设备端代码和CUDA运行时API调用中使用探查器(我认为,对于您自己的主机端代码来说,它也可以运行得比较好)。设置和确定要使用哪些选项需要一些麻烦,但这是值得的。

有时需要几毫秒,有时需要几十毫秒:SI会说,这在windows中是可以接受的。我有时会看到500毫秒左右的差异,但没有明显的原因,所以我不确定背景中发生了什么,但对我来说,这是正常的范围。再一次,我不相信那些只有几毫秒左右的奇怪的例子。你在其他平台上运行过类似的示例,没有出现同样的异常吗?我希望它在其他平台上仍然会出现,尽管没有那么多,因为不同操作系统上的时间限制量子你不会担心-/+10毫秒?时间太多了,伙计!:-(有时是几毫秒,有时是几十毫秒。:SI会说这在windows中是可以接受的。我曾看到过高达500毫秒的差异,有时没有明显的原因,所以我不确定背景中发生了什么,但这对我来说是在正常范围内。同样,我也不会相信那些奇怪的差异大约几毫秒。你在其他平台上运行过类似的示例,但没有出现相同的异常吗?我希望它在其他平台上仍然会出现,尽管由于不同操作系统上的时间限制,它不会出现那么多。你不会担心-/+10毫秒吗?这是很长的时间,伙计!:-(