Cuda 内核函数何时添加到GPU';谁在排队?

Cuda 内核函数何时添加到GPU';谁在排队?,cuda,Cuda,我需要知道内核函数在什么时候被添加到GPU队列。 我做了一次CUDA程序的ltrace,得到了几个调用,比如 1.cudaconfigurecall 2.cudamemcpy 我还得到了cudaLaunch() 我的问题是,在调用cudaLaunch时,或者在调用之前或之后,是否添加了特定的内核函数。 哪个函数负责将内核函数添加到队列中?调用cudaLaunch时会添加该函数。先前的API调用,例如cudaSetupArgument和cudaConfigureCall,为即将到来的内核启动保留并

我需要知道内核函数在什么时候被添加到GPU队列。 我做了一次CUDA程序的ltrace,得到了几个调用,比如 1.cudaconfigurecall 2.cudamemcpy 我还得到了cudaLaunch() 我的问题是,在调用cudaLaunch时,或者在调用之前或之后,是否添加了特定的内核函数。
哪个函数负责将内核函数添加到队列中?

调用
cudaLaunch
时会添加该函数。先前的API调用,例如
cudaSetupArgument
cudaConfigureCall
,为即将到来的内核启动保留并初始化调用堆栈帧,但是堆栈帧不会与给定的内核函数关联,并且在调用
cudaLaunch
之前不会推送到设备。所有这些函数在CUDA工具包中都有自己的文档,您可以阅读它们。

调用
cudaLaunch
时会添加函数。先前的API调用,例如
cudaSetupArgument
cudaConfigureCall
,为即将到来的内核启动保留并初始化调用堆栈帧,但是堆栈帧不会与给定的内核函数关联,并且在调用
cudaLaunch
之前不会推送到设备。所有这些函数在CUDA工具包中都有自己的文档,您可以阅读它们