Cuda 是否可以在CUM阵列上运行cuMemset?

Cuda 是否可以在CUM阵列上运行cuMemset?,cuda,memset,Cuda,Memset,我有一个CUarray,它是通过CUGraphicsSubreSourceGetMappedaray从OpenGL上下文获得的。是否有可能将其与CumeSet*一起使用?否。您无法将设备指针导入CUDA阵列以传递给CumeSet*,而且NVIDIA从未为CUDA阵列提供memset函数 您必须清空一些主机内存,并在CUDA阵列中执行一个或多个memcpy操作,或者如果您的应用程序仅在SM 2.0或更高版本上运行,请使用surface stores来启动自己的应用程序。否。您无法将设备指针导入CU

我有一个CUarray,它是通过CUGraphicsSubreSourceGetMappedaray从OpenGL上下文获得的。是否有可能将其与CumeSet*一起使用?

否。您无法将设备指针导入CUDA阵列以传递给CumeSet*,而且NVIDIA从未为CUDA阵列提供memset函数


您必须清空一些主机内存,并在CUDA阵列中执行一个或多个memcpy操作,或者如果您的应用程序仅在SM 2.0或更高版本上运行,请使用surface stores来启动自己的应用程序。

否。您无法将设备指针导入CUDA阵列以传递给CumeSet*,而且NVIDIA从未为CUDA阵列提供memset函数


您必须将一些主机内存归零,并在CUDA阵列中执行一个或多个memcpy,或者如果您的应用程序仅在SM 2.0或更高版本上运行,请使用surface stores来启动自己的应用程序。

谢谢!你对第二个提案的意思是什么?你自己在表面商店里购物?你是说编写一个内核,使用surf3dswrite清除数组吗?是的,这正是我的建议——而且令人高兴的是,由于surface load/store是非类型化的,因此可以编写一个模板函数来存储任意大小的操作数。2D示例见CUDA手册纹理章节第10.9.2节。谢谢我实现了这两种方法,并且更喜欢cuMemcpyAtoA方法而不是内核,因为它运行得更快!如果CUDA数组附加到renderbuffer或OpenGL中帧缓冲区对象的一部分纹理,也可以通过渲染glClear对其进行初始化,。。。。这是我使用的方法,它似乎运行得非常快。谢谢!你对第二个提案的意思是什么?你自己在表面商店里购物?你是说编写一个内核,使用surf3dswrite清除数组吗?是的,这正是我的建议——而且令人高兴的是,由于surface load/store是非类型化的,因此可以编写一个模板函数来存储任意大小的操作数。2D示例见CUDA手册纹理章节第10.9.2节。谢谢我实现了这两种方法,并且更喜欢cuMemcpyAtoA方法而不是内核,因为它运行得更快!如果CUDA数组附加到renderbuffer或OpenGL中帧缓冲区对象的一部分纹理,也可以通过渲染glClear对其进行初始化,。。。。这就是我使用的方法,它似乎运行得非常快。