Cuda 如何获取要执行的PTX文件

Cuda 如何获取要执行的PTX文件,cuda,nvcc,ptx,Cuda,Nvcc,Ptx,我知道如何从.cu生成.ptx文件,以及如何从.ptx.生成.cubin文件,但我不知道如何获得最终的可执行文件 更具体地说,我有一个sample.cu文件,它被编译成sample.ptx。然后我使用nvcc将sample.ptx编译成sample.cubin。但是,如果没有主机代码,则无法直接执行此.cubin文件。如何将.cubin文件链接到原始的.cu文件以生成最终的可执行文件?您应该能够使用cuModuleLoadDataEx直接从cuda驱动程序api运行ptx代码。第5页有一个例子,

我知道如何从
.cu
生成
.ptx
文件,以及如何从
.ptx.
生成
.cubin
文件,但我不知道如何获得最终的可执行文件


更具体地说,我有一个
sample.cu
文件,它被编译成
sample.ptx
。然后我使用nvcc将
sample.ptx
编译成
sample.cubin
。但是,如果没有主机代码,则无法直接执行此
.cubin
文件。如何将
.cubin
文件链接到原始的
.cu
文件以生成最终的可执行文件?

您应该能够使用cuModuleLoadDataEx直接从cuda驱动程序api运行ptx代码。第5页有一个例子,从CUDA 4.0开始,您可以在CUDA内核中编写内联PTX。

您接受的答案实际上不是您问题的答案。@einpoklum:不,这是他的问题的答案。很显然,你不知道CUDA自第一次发布以来就存在的一个特性