Cuda 如何获取要执行的PTX文件
我知道如何从Cuda 如何获取要执行的PTX文件,cuda,nvcc,ptx,Cuda,Nvcc,Ptx,我知道如何从.cu生成.ptx文件,以及如何从.ptx.生成.cubin文件,但我不知道如何获得最终的可执行文件 更具体地说,我有一个sample.cu文件,它被编译成sample.ptx。然后我使用nvcc将sample.ptx编译成sample.cubin。但是,如果没有主机代码,则无法直接执行此.cubin文件。如何将.cubin文件链接到原始的.cu文件以生成最终的可执行文件?您应该能够使用cuModuleLoadDataEx直接从cuda驱动程序api运行ptx代码。第5页有一个例子,
.cu
生成.ptx
文件,以及如何从.ptx.
生成.cubin
文件,但我不知道如何获得最终的可执行文件
更具体地说,我有一个
sample.cu
文件,它被编译成sample.ptx
。然后我使用nvcc将sample.ptx
编译成sample.cubin
。但是,如果没有主机代码,则无法直接执行此.cubin
文件。如何将.cubin
文件链接到原始的.cu
文件以生成最终的可执行文件?您应该能够使用cuModuleLoadDataEx直接从cuda驱动程序api运行ptx代码。第5页有一个例子,从CUDA 4.0开始,您可以在CUDA内核中编写内联PTX。您接受的答案实际上不是您问题的答案。@einpoklum:不,这是他的问题的答案。很显然,你不知道CUDA自第一次发布以来就存在的一个特性