C++ 关于CUDA';s架构(SM、SP)

C++ 关于CUDA';s架构(SM、SP),c++,c,visual-studio,cuda,gpgpu,C++,C,Visual Studio,Cuda,Gpgpu,我是一个刚刚开始CUDA编程的人。 似乎存在SP SM和CUDA体系结构的概念。 我曾尝试运行示例源的deviceQuery.cpp,我认为这是可行的,SP SM开发了他们的环境, 不知道SP是否为SM中的任何项目。 我认为第“(14)项多处理器、(8)CUDA内核/MP”和第(8)项适用于SP和SM,但我将纠正对以下内容的理解? SM=多处理器=14 SP=CUDA核心/MP=8 CUDA核心=14*8=112 顺便说一下,deviceQuery.cpp的结果如下。 CUDA设备查询(运行时

我是一个刚刚开始CUDA编程的人。
似乎存在SP SM和CUDA体系结构的概念。
我曾尝试运行示例源的deviceQuery.cpp,我认为这是可行的,SP SM开发了他们的环境,
不知道SP是否为SM中的任何项目。

我认为第“(14)项多处理器、(8)CUDA内核/MP”和第(8)项适用于SP和SM,但我将纠正对以下内容的理解?

SM=多处理器=14
SP=CUDA核心/MP=8
CUDA核心=14*8=112

顺便说一下,deviceQuery.cpp的结果如下。

CUDA设备查询(运行时API)版本(CUDART静态链接)

检测到1个支持CUDA的设备

设备0:“GeForce GTS 240
CUDA驱动程序版本/运行时版本5.5/5.5
CUDA能力主要/次要版本号:1.1
全局内存总量:1024 MB(1073741824字节)
(14) 多处理器,(8)CUDA内核/MP:112个CUDA内核
GPU时钟频率:1620 MHz(1.62 GHz)
内存时钟频率:1100 Mhz
内存总线宽度:256位
最大纹理尺寸(x,y,z)1D=(8192),2D=(6553632768),3
D=(204820482048)
最大分层1D纹理大小,(num)层1D=(8192),512层
最大分层2D纹理大小,(num)层2D=(81928192),512层
恒定内存总量:65536字节
每个块的共享内存总量:16384字节
每个块可用的寄存器总数:8192
经纱尺寸:32
每个多处理器的最大线程数:768
每个块的最大线程数:512
螺纹块的最大尺寸(x、y、z):(512、512、64)
网格大小(x,y,z)的最大尺寸大小:(65535,65535,1)
最大内存间距:2147483647字节
纹理对齐:256字节
并发复制和内核执行:是,使用1个复制引擎
内核的运行时间限制:是
集成GPU共享主机内存:否
支持主机页锁定内存映射:是
表面对齐要求:是
设备具有ECC支持:已禁用
设备支持统一寻址(UVA):否
设备PCI总线ID/PCI位置ID:9/0
计算模式:
<默认值(多个主机线程可以对设备simu使用::cudaSetDevice() 同时)>

根据你所说的,你是正确的:

SM=流式多处理器

SP=流处理器=CUDA核心


SP/CUDA内核总数=SM数量*每个SM的SP/CUDA内核数量

谢谢用户2802841。我明白了!