C++ 如何计算CUDA线程内矩阵的指数?
我需要能够计算CUDA内核中矩阵的指数。是否有任何库可以从CUDA线程中调用其用于此任务的函数?或者,是否可以从头开始将此功能作为C++ 如何计算CUDA线程内矩阵的指数?,c++,matrix,cuda,exponential,C++,Matrix,Cuda,Exponential,我需要能够计算CUDA内核中矩阵的指数。是否有任何库可以从CUDA线程中调用其用于此任务的函数?或者,是否可以从头开始将此功能作为\uuu设备\uuu功能来实现 我正在使用MicrosoftVisualStudio2008Express进行主机代码编译,并使用Toolkit3.2v中的nvcc编译器 GPU:NVIDIA GeForce GT640(计算能力3.0)不,CUDA库中没有此类内容,但您可以查看以下代码,以帮助您在CUDA中设计解决方案: 如果您使用的是架构3.5,那么通过从另一个
\uuu设备\uuu
功能来实现
我正在使用MicrosoftVisualStudio2008Express进行主机代码编译,并使用Toolkit3.2v中的nvcc编译器
GPU:NVIDIA GeForce GT640(计算能力3.0)不,CUDA库中没有此类内容,但您可以查看以下代码,以帮助您在CUDA中设计解决方案: 如果您使用的是架构3.5,那么通过从另一个
\uuuuuu global\uuuuu
内核调用\uuuu global\uuuuuu
内核来解决问题(使用动态并行),而无需返回主机,这样您就可以设置要执行它的配置(线程和块)
基本上:
__global__ child( ... )
{
....
}
__global__ parent( ... )
{
child<<< ..., ... >>>( ... )
}
\uuuuu全局子项(…)
{
....
}
__全局父项(…)
{
儿童>(…)
}
希望这能有所帮助如果使用cc>3.5的卡,您可以从内核中调用cuBLAS例程。这将有助于执行所需的矩阵乘法。