CUDA计算能力之间有什么区别?

CUDA计算能力之间有什么区别?,cuda,Cuda,计算能力2.0比1.3增加了什么,2.1比2.0增加了什么,3.0比2.1增加了什么?计算能力指定了不同的体系结构。通常,较新的体系结构比以前的体系结构运行CUDA程序和图形更快。但请注意,上一代中的高端卡可能比下一代中的低端卡快 从CUDA C编程指南(v6.0)中: 有一个相当好的概述。我投票决定重新开放。我认为这个问题是有主题的。这个问题绝对是有主题的。现在cuda compute capability 6.1(以及6.0、5.2)已经推出,我想了解一下新功能。投票重新打开问题以启用新答案

计算能力2.0比1.3增加了什么,2.1比2.0增加了什么,3.0比2.1增加了什么?

计算能力指定了不同的体系结构。通常,较新的体系结构比以前的体系结构运行CUDA程序和图形更快。但请注意,上一代中的高端卡可能比下一代中的低端卡快

从CUDA C编程指南(v6.0)中:


有一个相当好的概述。我投票决定重新开放。我认为这个问题是有主题的。这个问题绝对是有主题的。现在cuda compute capability 6.1(以及6.0、5.2)已经推出,我想了解一下新功能。投票重新打开问题以启用新答案和编辑。这个问题绝对是关于这个主题的,并且对编程有很大影响:一些CUDA框架限制了最小的计算能力。谢谢,这很有帮助。很遗憾,他们将计算线和图形线分开,因为我怀疑这会使计算线更加昂贵,因为它们不会从大众图形市场带来的成本优势中获益。鉴于此,为较低的计算能力(例如1.1而不是3.0)编译是否有意义,即使你的卡支持3.0,它会运行得更快吗?@user1191840:如果你为一个旧的架构编译,为什么它会运行得更快?不知道为什么,但我认为这是我观察到的,尽管我还没有回去测试它。我认为这是可能的,因为nvidia正试图限制后期(geforce)卡的计算性能,这可能与计算版本有关。有关更多更新信息,请参阅的官方参考。