Cluster computing 技术计算:每个周期的CPU指令和每个周期的触发器是否相同?

Cluster computing 技术计算:每个周期的CPU指令和每个周期的触发器是否相同?,cluster-computing,Cluster Computing,每个周期的CPU指令和每个周期的触发器是否相同 如何查找每个CPU周期的CPU指令 英特尔(R)Core(TM)i5-2540M处理器@2.60GHz不,它不一样 是每秒的浮点运算。这是一种度量,因为与其他操作相比,历史上的浮点操作是非常昂贵的操作 将是每个周期执行的任何类型指令的平均值。您将需要一个特定的测试用例来衡量这一点,因为每个周期可以执行的指令数量因指令的作用而变化很大。例如,如果执行的第一条指令是一条分支,而CPU没有正确预测分支,那么这将是该循环中唯一执行的指令 在上,您可以发现特

每个周期的CPU指令和每个周期的触发器是否相同

如何查找每个CPU周期的CPU指令

英特尔(R)Core(TM)i5-2540M处理器@2.60GHz不,它不一样

是每秒的浮点运算。这是一种度量,因为与其他操作相比,历史上的浮点操作是非常昂贵的操作

将是每个周期执行的任何类型指令的平均值。您将需要一个特定的测试用例来衡量这一点,因为每个周期可以执行的指令数量因指令的作用而变化很大。例如,如果执行的第一条指令是一条分支,而CPU没有正确预测分支,那么这将是该循环中唯一执行的指令

在上,您可以发现特定处理器具有此测量速度:

2.42 GFLOPS/core
9.65 GFLOPS/computer

这是每秒千兆浮点运算。如果您希望将其作为每个周期的FLO,您可以将其与CPU频率分开。

该页面上的浮点数字严重偏离基准。所讨论的处理器是一个沙桥处理器,具有3.3 GHz的turbo,因此Rmax/核心是(3.3千兆周/秒)*(2个向量运算/周期)*(4个双精度触发器/向量运算)=26.4千兆次/核心(单精度的数字是该数字的两倍)。实现的Rpeak将根据工作负载的不同而有所不同,但对于已优化的计算密集型任务,在使用两个核心时,Rpeak通常应超过40 GFLOPS。否则,答案很好(尽管应该指出,一条指令也可以表示多个触发器)。