Embedded 手臂皮质M0使用多少个周期来乘浮点数?

Embedded 手臂皮质M0使用多少个周期来乘浮点数?,embedded,arm,Embedded,Arm,在手臂皮质m0上: 执行单精度浮点乘法并将其存储到浮点中需要多少个周期?i、 e.x=a*b其中x、a和b是单精度IEE 754浮点。答案显然取决于编译器的软件浮点实现。您可以测量它,也可以在调试器中单步执行代码并计算执行的指令 有一个问题,其答案表明在英特尔XScale示例中有35个周期,这可能与您的目标大致相当,但这是一个FPU仿真示例。在FPU仿真中,FPU指令会在没有FPU的硬件上导致无效的指令异常,异常处理程序会解释指令并调用相应的软件函数-这会带来很小的开销,这在直接软件实现中是不存

在手臂皮质m0上:


执行单精度浮点乘法并将其存储到浮点中需要多少个周期?i、 e.x=a*b其中x、a和b是单精度IEE 754浮点。

答案显然取决于编译器的软件浮点实现。您可以测量它,也可以在调试器中单步执行代码并计算执行的指令


有一个问题,其答案表明在英特尔XScale示例中有35个周期,这可能与您的目标大致相当,但这是一个FPU仿真示例。在FPU仿真中,FPU指令会在没有FPU的硬件上导致无效的指令异常,异常处理程序会解释指令并调用相应的软件函数-这会带来很小的开销,这在直接软件实现中是不存在的。

答案显然取决于编译器的软件浮点实现。您可以测量它,也可以在调试器中单步执行代码并计算执行的指令


有一个问题,其答案表明在英特尔XScale示例中有35个周期,这可能与您的目标大致相当,但这是一个FPU仿真示例。在FPU仿真中,FPU指令会在没有FPU的硬件上导致无效的指令异常,异常处理程序会解释指令并调用相应的软件函数-这会带来很小的开销,这在直接软件实现中是不存在的。

答案显然取决于编译器的软件浮点实现。您可以测量它,也可以在调试器中单步执行代码并计算执行的指令


有一个问题,其答案表明在英特尔XScale示例中有35个周期,这可能与您的目标大致相当,但这是一个FPU仿真示例。在FPU仿真中,FPU指令会在没有FPU的硬件上导致无效的指令异常,异常处理程序会解释指令并调用相应的软件函数-这会带来很小的开销,这在直接软件实现中是不存在的。

答案显然取决于编译器的软件浮点实现。您可以测量它,也可以在调试器中单步执行代码并计算执行的指令


有一个问题,其答案表明在英特尔XScale示例中有35个周期,这可能与您的目标大致相当,但这是一个FPU仿真示例。使用FPU仿真,FPU指令会在没有FPU的硬件上导致无效的指令异常,异常处理程序会解释指令并调用相应的软件功能-这其中有一小部分开销,这在直接软件实现中是不会有的。

计时花了多长时间?你是如何计时的?考虑到M0没有FPU,必须用软件来计时;可能很多,取决于实施情况。我想你可以拆开你的浮点库,把它们加起来,但是基准测试(考虑中断)可能更明智。我没有任何硬件来尝试这个。但我想,这是知道基于库的浮点运算的计算时间可以根据输入流而变化的唯一方法,所以在进行基准测试时,一定要包括各种数字……计时需要多长时间?你是如何计时的?考虑到M0没有FPU,必须用软件来计时;可能很多,取决于实施情况。我想你可以拆开你的浮点库,把它们加起来,但是基准测试(考虑中断)可能更明智。我没有任何硬件来尝试这个。但我想,这是知道基于库的浮点运算的计算时间可以根据输入流而变化的唯一方法,所以在进行基准测试时,一定要包括各种数字……计时需要多长时间?你是如何计时的?考虑到M0没有FPU,必须用软件来计时;可能很多,取决于实施情况。我想你可以拆开你的浮点库,把它们加起来,但是基准测试(考虑中断)可能更明智。我没有任何硬件来尝试这个。但我想,这是知道基于库的浮点运算的计算时间可以根据输入流而变化的唯一方法,所以在进行基准测试时,一定要包括各种数字……计时需要多长时间?你是如何计时的?考虑到M0没有FPU,必须用软件来计时;可能很多,取决于实施情况。我想你可以拆开你的浮点库,把它们加起来,但是基准测试(考虑中断)可能更明智。我没有任何硬件来尝试这个。但我想,这是知道基于库的浮点计算时间可以根据输入流而变化的唯一方法,所以在进行基准测试时,一定要包括各种数字。。。