LLVM NVPTX后端与CUDA5动态并行

LLVM NVPTX后端与CUDA5动态并行,cuda,llvm,nvidia,ptx,Cuda,Llvm,Nvidia,Ptx,LLVM的NVPTX后端(由NVIDIA提供)是否支持CUDA5/Compute Capability 3.5设备中的新动态并行功能 我在标题为“从PTX启动设备端”的部分中找到了一些信息。似乎可以从PTX访问一个名为cudaLaunchDevice()的函数,用户只需在PTX中声明此函数,然后调用它: // When .address_size is 64 .extern .func(.param .b32 func_retval0) cudaLaunchDevice ( .param .b6

LLVM的NVPTX后端(由NVIDIA提供)是否支持CUDA5/Compute Capability 3.5设备中的新动态并行功能

我在标题为“从PTX启动设备端”的部分中找到了一些信息。似乎可以从PTX访问一个名为cudaLaunchDevice()的函数,用户只需在PTX中声明此函数,然后调用它:

// When .address_size is 64
.extern .func(.param .b32 func_retval0) cudaLaunchDevice
(
.param .b64 func,
.param .b64 parameterBuffer,
.param .align 4 .b8 gridDimension[12],
.param .align 4 .b8 blockDimension[12],
.param .b32 sharedMemSize,
.param .b64 stream
)
;
所以我假设答案是在LLVM IR中声明这个函数,然后使用它。我还没有测试这个解决方案