每个指令CUDA的时钟周期数

每个指令CUDA的时钟周期数,cuda,Cuda,我是CUDA的初学者。现在,我正在计算每条指令的时钟周期数(例如加法)。在中,它仅给出不同算术运算的指令吞吐量。例如,对于32位浮点加法,7.x中的吞吐量为64。那么,我可以将64/32=2作为每条指令的时钟周期数吗?如果没有,我如何计算它?在一般情况下,CUDA文档没有提供足够的信息来计算特定指令所需的时钟周期数。这将与指令的管道深度有关(即为该指令提供服务的功能单元的管道深度),但没有记录在案。吞吐量表对于此练习基本上是无用的 这就是为什么你会发现各种各样的CUDA微标记文件的原因之一 对于

我是CUDA的初学者。现在,我正在计算每条指令的时钟周期数(例如加法)。在中,它仅给出不同算术运算的指令吞吐量。例如,对于32位浮点加法,7.x中的吞吐量为64。那么,我可以将64/32=2作为每条指令的时钟周期数吗?如果没有,我如何计算它?

在一般情况下,CUDA文档没有提供足够的信息来计算特定指令所需的时钟周期数。这将与指令的管道深度有关(即为该指令提供服务的功能单元的管道深度),但没有记录在案。吞吐量表对于此练习基本上是无用的

这就是为什么你会发现各种各样的CUDA微标记文件的原因之一

对于每一个感兴趣的架构和每一个感兴趣的架构,都必须根据经验(仔细地)进行度量;没有记录在案