Performance 并行流水线-大向量
有人能给我解释一下关于大向量的管道概念吗 我发现下面的图表,考虑到矢量长度,与加速比有关。当向量长度大于向量寄存器的长度时,就会给出这种行为。我不理解锯齿的出现。。。谢谢你的帮助Performance 并行流水线-大向量,performance,vector,parallel-processing,Performance,Vector,Parallel Processing,有人能给我解释一下关于大向量的管道概念吗 我发现下面的图表,考虑到矢量长度,与加速比有关。当向量长度大于向量寄存器的长度时,就会给出这种行为。我不理解锯齿的出现。。。谢谢你的帮助 你能告诉我这个的来源吗?或者您可以给出其他细节:例如,执行的向量操作是什么,在哪种架构类型上?性能不连续通常会发生,因为当提高向量大小时,其中一个缓存在某个点不能包含整个输入数据。但是,我不知道它与流水线有什么关系。在现代处理器(和许多旧系统)上,有向量指令(例如)可以比一次一个地执行操作更快地对连续的、对齐的数据块执
你能告诉我这个的来源吗?或者您可以给出其他细节:例如,执行的向量操作是什么,在哪种架构类型上?性能不连续通常会发生,因为当提高向量大小时,其中一个缓存在某个点不能包含整个输入数据。但是,我不知道它与流水线有什么关系。在现代处理器(和许多旧系统)上,有向量指令(例如)可以比一次一个地执行操作更快地对连续的、对齐的数据块执行操作,因此您可以获得更高的(有效的)浮点运算每秒做的向量运算比标量运算多。所以,如果您有(比如)64字节的向量处理宽度,那么您可以在64字节块中获得最高的有效浮点或MIPS速率处理数据。剩余的项目以较低的MIPS速率一次处理一个,降低了平均值。@JonathanDursi我同意,但为什么在64元素向量上的操作会比在60元素向量上的操作获得更高的MIPS。我认为SIMD指令的最大向量寄存器大小为512bit(即8倍)。向量长度是以位、字节还是双精度给出的?@Emilien-yes。很明显,这个图表试图指出一些向量长度为64左右的特征,直到OP回答你的问题,这就是我们所知道的全部。