X86 在英特尔I7芯片上,IEEE 754双运算的成本有多高?

X86 在英特尔I7芯片上,IEEE 754双运算的成本有多高?,x86,double,bit-manipulation,intel,ieee,X86,Double,Bit Manipulation,Intel,Ieee,我想要一个估计,例如,一个除法相对于加法要贵多少,在英特尔处理器上,IEEE 754加倍。我需要它来估计哪些操作可以在特定的内部循环中提高性能。来自第14-14页和第14-15页 ADDSD的延迟为5个周期,吞吐量为1个/周期 DIVSD的延迟为62个周期,吞吐量为1/61个周期 所以,如果您的代码存在严重的数据依赖性问题,那么加法的速度大约是除法的12倍。然而,通过仔细的优化,您可以使加法比除法快61倍。其他因素可能会使差距变大。-1因为缺乏研究工作,加上它与c或c++标记无关……为什么会

我想要一个估计,例如,一个除法相对于加法要贵多少,在英特尔处理器上,IEEE 754加倍。我需要它来估计哪些操作可以在特定的内部循环中提高性能。

来自第14-14页和第14-15页

  • ADDSD
    的延迟为5个周期,吞吐量为1个/周期

  • DIVSD
    的延迟为62个周期,吞吐量为1/61个周期


所以,如果您的代码存在严重的数据依赖性问题,那么加法的速度大约是除法的12倍。然而,通过仔细的优化,您可以使加法比除法快61倍。其他因素可能会使差距变大。

-1因为缺乏研究工作,加上它与
c
c++
标记无关……为什么会涉及位操纵?最明显的是,除非您正在编写汇编,您只能猜测编译器正在生成哪些指令,或者只需查看生成的程序集(无需猜测);哪种IMO是编写程序集(编写源代码并监视编译器输出)的非常好的方法。编译器大部分时间都在编写惊人的程序集,但有时需要人工检查代码。