Performance GPU上的整数计算

Performance GPU上的整数计算,performance,optimization,integer,gpgpu,Performance,Optimization,Integer,Gpgpu,对于我的工作来说,做整数计算特别有趣,这显然不是GPU的用途。我的问题是:现代GPU支持高效的整数运算吗?我意识到这对我自己来说应该很容易理解,但我发现了相互矛盾的答案(例如vs),所以我认为最好问一下 还有,在GPU上有任意精度整数的库/技术吗?首先,你需要考虑你正在使用的硬件:GPU设备的性能与构造函数有很大的不同。 其次,它还取决于所考虑的操作:例如,加法可能比乘法快 就我而言,我只使用NVIDIA设备。对于这类硬件:宣布使用新架构(费米)实现32位整数和32位单精度浮点的同等性能。以前的

对于我的工作来说,做整数计算特别有趣,这显然不是GPU的用途。我的问题是:现代GPU支持高效的整数运算吗?我意识到这对我自己来说应该很容易理解,但我发现了相互矛盾的答案(例如vs),所以我认为最好问一下


还有,在GPU上有任意精度整数的库/技术吗?

首先,你需要考虑你正在使用的硬件:GPU设备的性能与构造函数有很大的不同。 其次,它还取决于所考虑的操作:例如,加法可能比乘法快

就我而言,我只使用NVIDIA设备。对于这类硬件:宣布使用新架构(费米)实现32位整数和32位单精度浮点的同等性能。以前的体系结构(Tesla)用于为32位整数和浮点提供等效性能,但仅在考虑加法和逻辑运算时


但再一次,根据您使用的设备和指令,这可能不是真的。

我认为需要注意的是,几乎所有架构都可以使用GPU上的所有CUDA内核进行整数运算,但整数没有融合乘法加法,因此每秒的峰值整数运算只有峰值浮点运算的一半。