C++ 关于CUDA'；s架构（SM、SP）_C++_C_Visual Studio_Cuda_Gpgpu

C++ 关于CUDA'；s架构（SM、SP）

c++ c visual-studio cuda

C++ 关于CUDA'；s架构（SM、SP）,c++,c,visual-studio,cuda,gpgpu,C++,C,Visual Studio,Cuda,Gpgpu,我是一个刚刚开始CUDA编程的人。似乎存在SP SM和CUDA体系结构的概念。我曾尝试运行示例源的deviceQuery.cpp，我认为这是可行的，SP SM开发了他们的环境，不知道SP是否为SM中的任何项目。我认为第“（14）项多处理器、（8）CUDA内核/MP”和第（8）项适用于SP和SM，但我将纠正对以下内容的理解？ SM=多处理器=14 SP=CUDA核心/MP=8 CUDA核心=14*8=112 顺便说一下，deviceQuery.cpp的结果如下。 CUDA设备查询（运行时

我是一个刚刚开始CUDA编程的人。
似乎存在SP SM和CUDA体系结构的概念。
我曾尝试运行示例源的deviceQuery.cpp，我认为这是可行的，SP SM开发了他们的环境，
不知道SP是否为SM中的任何项目。

我认为第“（14）项多处理器、（8）CUDA内核/MP”和第（8）项适用于SP和SM，但我将纠正对以下内容的理解？

SM=多处理器=14
SP=CUDA核心/MP=8
CUDA核心=14*8=112

顺便说一下，deviceQuery.cpp的结果如下。

CUDA设备查询（运行时API）版本（CUDART静态链接）

检测到1个支持CUDA的设备

设备0：“GeForce GTS 240
CUDA驱动程序版本/运行时版本5.5/5.5
CUDA能力主要/次要版本号：1.1
全局内存总量：1024 MB（1073741824字节）
（14）多处理器，（8）CUDA内核/MP:112个CUDA内核
GPU时钟频率：1620 MHz（1.62 GHz）
内存时钟频率：1100 Mhz
内存总线宽度：256位
最大纹理尺寸（x，y，z）1D=（8192），2D=（6553632768），3
D=（204820482048）
最大分层1D纹理大小，（num）层1D=（8192），512层
最大分层2D纹理大小，（num）层2D=（81928192），512层
恒定内存总量：65536字节
每个块的共享内存总量：16384字节
每个块可用的寄存器总数：8192
经纱尺寸：32
每个多处理器的最大线程数：768
每个块的最大线程数：512
螺纹块的最大尺寸（x、y、z）：（512、512、64）
网格大小（x，y，z）的最大尺寸大小：（65535，65535，1）
最大内存间距：2147483647字节
纹理对齐：256字节
并发复制和内核执行：是，使用1个复制引擎
内核的运行时间限制：是
集成GPU共享主机内存：否
支持主机页锁定内存映射：是
表面对齐要求：是
设备具有ECC支持：已禁用
设备支持统一寻址（UVA）：否
设备PCI总线ID/PCI位置ID:9/0
计算模式：
<默认值（多个主机线程可以对设备simu使用：：cudaSetDevice（）同时）>

根据你所说的，你是正确的：

SM=流式多处理器

SP=流处理器=CUDA核心

SP/CUDA内核总数=SM数量*每个SM的SP/CUDA内核数量

谢谢用户2802841。我明白了！