Architecture 对于阵列密集型计算,一种体系结构比另一种体系结构有什么优势?

Architecture 对于阵列密集型计算,一种体系结构比另一种体系结构有什么优势?,architecture,hardware,cpu-architecture,Architecture,Hardware,Cpu Architecture,我很想知道是否存在一种能够更快地处理阵列密集型计算的体系结构。例如某些在MIPS工作站上运行的任意C代码是否会比在x86工作站上运行时更快完成?我想一个更好的问题是一些架构是否有更快的FPU 我知道,对于重型阵列和矩阵运算,其中一个较新的选择是GPU计算和使用诸如Nvidia的CUDA之类的工具,但我更感兴趣的是传统CPU级别上存在的问题。谢谢 在当时,许多超级计算机基本上同时在多个阵列元素上运行。它们仍然在一些利基领域使用(wiki文章提到了视频游戏),但不适用于典型的桌面。在标准桌面上,最接

我很想知道是否存在一种能够更快地处理阵列密集型计算的体系结构。例如某些在MIPS工作站上运行的任意C代码是否会比在x86工作站上运行时更快完成?我想一个更好的问题是一些架构是否有更快的FPU


我知道,对于重型阵列和矩阵运算,其中一个较新的选择是GPU计算和使用诸如Nvidia的CUDA之类的工具,但我更感兴趣的是传统CPU级别上存在的问题。谢谢

在当时,许多超级计算机基本上同时在多个阵列元素上运行。它们仍然在一些利基领域使用(wiki文章提到了视频游戏),但不适用于典型的桌面。在标准桌面上,最接近的可能是使用GPU进行非图形工作。

回到过去,许多超级计算机基本上同时在多个阵列元素上运行。它们仍然在一些利基领域使用(wiki文章提到了视频游戏),但不适用于典型的桌面。在标准桌面上,最接近的可能就是将GPU用于非图形工作。

当然有架构上的优势和劣势。曾经有一段时间,PowerPC芯片在一系列浮点密集型基准测试中始终击败其英特尔同行。这种差异反映在他们运行我当时正在研究的一些核物理代码的速度上

然而,他们像狗一样运行Word和Excel,然后他们的时钟速度真的开始下滑,桌面上的PowerPC芯片的一切都结束了。我认为苹果只会坚持使用它们,直到它们能够让多架构执行层顺利工作为止


还要注意的是,现在许多体系结构都有SIMD(单指令多数据,即矢量化)浮点和整数运算单元(如AltiVec、MMX、SSE等)。与GPU等特殊用途处理器相比,这些处理器在通用芯片中只得到了轻微的矢量化。

当然有架构上的优势和劣势。曾经有一段时间,PowerPC芯片在一系列浮点密集型基准测试中始终击败其英特尔同行。这种差异反映在他们运行我当时正在研究的一些核物理代码的速度上

然而,他们像狗一样运行Word和Excel,然后他们的时钟速度真的开始下滑,桌面上的PowerPC芯片的一切都结束了。我认为苹果只会坚持使用它们,直到它们能够让多架构执行层顺利工作为止


还要注意的是,现在许多体系结构都有SIMD(单指令多数据,即矢量化)浮点和整数运算单元(如AltiVec、MMX、SSE等)。与专用处理器(如GPU)相比,通用芯片中的这些指令仅略微矢量化。

此外,现代处理器的SIMD指令(SSE/MMX)的灵感来源于古时候的矢量处理器。此外,现代处理器的SIMD指令(SSE/MMX)的灵感来源于古时候的矢量处理器。