Cuda性能问题
也许这个问题有点过于笼统,但也许有人也经历过同样的问题 我有一个使用推力的小型cuda程序,一切都很好。它按预期工作Cuda性能问题,cuda,thrust,Cuda,Thrust,也许这个问题有点过于笼统,但也许有人也经历过同样的问题 我有一个使用推力的小型cuda程序,一切都很好。它按预期工作 但是,当我把同一个程序移植到另一台机器上时,整个程序的性能比原来的机器慢10到100倍。第二台机器的硬件应该更快(GTX480而不是GTX265),所以我想问题出在第二台机器本身。有人知道会出什么问题吗?是的,--arch=sm\u 20解决了问题。是的,--arch=sm\u 20解决了问题。我想我找到了解决办法。必须在GTX480设备上使用--arch=sm_20进行编译。我
但是,当我把同一个程序移植到另一台机器上时,整个程序的性能比原来的机器慢10到100倍。第二台机器的硬件应该更快(GTX480而不是GTX265),所以我想问题出在第二台机器本身。有人知道会出什么问题吗?是的,--arch=sm\u 20解决了问题。是的,--arch=sm\u 20解决了问题。我想我找到了解决办法。必须在GTX480设备上使用--arch=sm_20进行编译。我用了--arch=sm_13。我想我找到了解决办法。必须在GTX480设备上使用--arch=sm_20进行编译。我用了--arch=sm_13。