.net 具有纹理的CUDA中的GPU性能
我有一个关于NVIDIA GPU性能的问题。我有一个在两个数组之间进行插值的实现。使用倾斜到线性内存的纹理比使用CUDA阵列更快。现在我只在一个GPU上试过。 这是每个GPU上的情况,还是会有差异? 我在笔记本电脑中使用GPU。 桌面GPU快得多吗?因为目前我只获得2-3的加速 我可能看起来是个愚蠢的问题,但如果有人能在许多GPU上使用纹理,我会非常感激。使用CUDA阵列(应该有一些缓存优化…)速度较慢,这让我感到奇怪.net 具有纹理的CUDA中的GPU性能,.net,cuda,.net,Cuda,我有一个关于NVIDIA GPU性能的问题。我有一个在两个数组之间进行插值的实现。使用倾斜到线性内存的纹理比使用CUDA阵列更快。现在我只在一个GPU上试过。 这是每个GPU上的情况,还是会有差异? 我在笔记本电脑中使用GPU。 桌面GPU快得多吗?因为目前我只获得2-3的加速 我可能看起来是个愚蠢的问题,但如果有人能在许多GPU上使用纹理,我会非常感激。使用CUDA阵列(应该有一些缓存优化…)速度较慢,这让我感到奇怪 我正在开发一款NVIDIA Quadro 2000m,并将其与I7-2860
我正在开发一款NVIDIA Quadro 2000m,并将其与I7-2860QM@2,50GHZ(实现)进行比较。这是一场公平的比赛吗 具有2.0或更高计算能力的GPU缓存全局内存以及纹理,因此纹理在CC 1.x时代的主要优势不再存在 恰恰相反,关于纹理的一个很少提及的事实是,由于需要在硬连线布局的寄存器中存储多个参数和返回值,因此纹理可能会增加寄存器压力。此外,全局内存的缓存比纹理内存的缓存大。因此,通过纹理读取内存的速度比直接访问全局内存的速度要慢,这并不意外
这一特性对于移动或桌面GPU应该是相同的,即使高端桌面GPU比移动设备快2到5倍。这里,反之亦然,cuda阵列比倾斜内存更快:只是为了确保-您是在谈论全局内存访问与纹理,还是线性内存中的纹理与cuda阵列中的纹理?如果是后者,我下面的答案就不适用了。我在谈论线性内存中的纹理与cuda数组中的纹理