C++ 如何计算CUDA线程内矩阵的指数?

C++ 如何计算CUDA线程内矩阵的指数?,c++,matrix,cuda,exponential,C++,Matrix,Cuda,Exponential,我需要能够计算CUDA内核中矩阵的指数。是否有任何库可以从CUDA线程中调用其用于此任务的函数?或者,是否可以从头开始将此功能作为\uuu设备\uuu功能来实现 我正在使用MicrosoftVisualStudio2008Express进行主机代码编译,并使用Toolkit3.2v中的nvcc编译器 GPU:NVIDIA GeForce GT640(计算能力3.0)不,CUDA库中没有此类内容,但您可以查看以下代码,以帮助您在CUDA中设计解决方案: 如果您使用的是架构3.5,那么通过从另一个

我需要能够计算CUDA内核中矩阵的指数。是否有任何库可以从CUDA线程中调用其用于此任务的函数?或者,是否可以从头开始将此功能作为
\uuu设备\uuu
功能来实现

我正在使用MicrosoftVisualStudio2008Express进行主机代码编译,并使用Toolkit3.2v中的nvcc编译器


GPU:NVIDIA GeForce GT640(计算能力3.0)

不,CUDA库中没有此类内容,但您可以查看以下代码,以帮助您在CUDA中设计解决方案:

如果您使用的是架构3.5,那么通过从另一个
\uuuuuu global\uuuuu
内核调用
\uuuu global\uuuuuu
内核来解决问题(使用动态并行),而无需返回主机,这样您就可以设置要执行它的配置(线程和块)

基本上:

__global__ child( ... ) 
{
   ....
}

__global__ parent( ... )
{
   child<<< ..., ... >>>( ... )
}
\uuuuu全局子项(…)
{
....
}
__全局父项(…)
{
儿童>(…)
}

希望这能有所帮助

如果使用cc>3.5的卡,您可以从内核中调用cuBLAS例程。这将有助于执行所需的矩阵乘法。