计算单元、SMX、CUDA核等之间的关系是什么。?

计算单元、SMX、CUDA核等之间的关系是什么。?,cuda,opencl,core,Cuda,Opencl,Core,我对这些术语很困惑。。。我知道nVidia GPU有一些流式多处理器SMX,每个处理器由许多CUDA核心流式处理器SP组成。但是我似乎不知道这如何应用于OpenCL计算单元 例如,我的GeForce GTS 250表示它有16个计算单元。nVidia官方网站拥有128个CUDA内核。然而,一些论文说计算单元本身是一个核心 那么哪一个是哪一个呢?另外,其中哪一个执行OpenCL工作组?到目前为止,我认为一个工作组是在CUDA核心上执行的。但是OpenCL规范在一个计算单元上执行它,这个计算单元应该

我对这些术语很困惑。。。我知道nVidia GPU有一些流式多处理器SMX,每个处理器由许多CUDA核心流式处理器SP组成。但是我似乎不知道这如何应用于OpenCL计算单元

例如,我的GeForce GTS 250表示它有16个计算单元。nVidia官方网站拥有128个CUDA内核。然而,一些论文说计算单元本身是一个核心

那么哪一个是哪一个呢?另外,其中哪一个执行OpenCL工作组?到目前为止,我认为一个工作组是在CUDA核心上执行的。但是OpenCL规范在一个计算单元上执行它,这个计算单元应该是SMX


老实说,WTF???

在考虑OpenCL时,我会完全忽略“核心”这个术语,因为不同的硬件供应商对它的实际含义有不同的看法,正如您已经发现的那样。无论是SM还是“CUDA核心”都不能直接与传统CPU核心相比

对于NVIDIA硬件,SM是一个OpenCL计算单元。因此,每个工作组将分配给一个SM,尽管每个SM能够同时运行多个工作组