如何用Java编写正确的微基准测试？_Java_Jvm_Benchmarking_Jvm Hotspot_Microbenchmark

如何用Java编写正确的微基准测试？

java jvm

如何用Java编写正确的微基准测试？,java,jvm,benchmarking,jvm-hotspot,microbenchmark,Java,Jvm,Benchmarking,Jvm Hotspot,Microbenchmark,如何用Java编写（并运行）正确的微基准测试我正在寻找一些代码示例和注释，说明需要考虑的各种问题示例：基准测试应该测量时间/迭代还是迭代/时间，为什么相关：Java基准测试的重要内容是：在计时之前，先运行代码几次，预热JIT 确保运行足够长的时间，以便能够在几秒钟或（更好的）几十秒钟内测量结果虽然您不能在迭代之间调用System.gc（），但最好在测试之间运行它，这样每个测试都会有一个“干净”的内存空间来使用。（是的，gc（）与其说是一种保证，不如说是一种暗示，但根据我的经验，它很可

如何用Java编写（并运行）正确的微基准测试

我正在寻找一些代码示例和注释，说明需要考虑的各种问题

示例：基准测试应该测量时间/迭代还是迭代/时间，为什么

相关：

Java基准测试的重要内容是：

在计时之前，先运行代码几次，预热JIT
确保运行足够长的时间，以便能够在几秒钟或（更好的）几十秒钟内测量结果
虽然您不能在迭代之间调用
```
System.gc（）
```
，但最好在测试之间运行它，这样每个测试都会有一个“干净”的内存空间来使用。（是的，
```
gc（）
```
与其说是一种保证，不如说是一种暗示，但根据我的经验，它很可能真的会进行垃圾收集。）
我喜欢显示迭代和时间，以及可以缩放的时间/迭代分数，以便“最佳”算法的分数为1.0，其他算法的分数相对较高。这意味着您可以在较长的时间内运行所有算法，改变迭代次数和时间，但仍然可以获得可比的结果

我正在写关于.NET中基准测试框架设计的博客。我有一个很好的例子，也许能给你一些想法——当然，不是所有的东西都合适，但其中一些可能是合适的。

用Java编写微基准有很多可能的陷阱

首先：你必须计算各种各样的事件，这些事件或多或少都是随机的：垃圾收集、缓存效果（文件的操作系统和内存的CPU）、IO等等

第二：在很短的时间间隔内，你不能相信测量时间的准确性

第三：JVM在执行时优化代码。因此，同一JVM实例中的不同运行速度将越来越快

我的建议是：让基准测试运行几秒钟，这比运行时间超过毫秒更可靠。预热JVM（意味着至少运行一次基准测试而不测量JVM是否可以运行优化）。然后运行您的基准多次（可能5次）并取中值。在新的JVM实例中运行每个微基准测试（调用每个基准测试新Java），否则JVM的优化效果可能会影响以后运行的测试。不要执行在预热阶段没有执行的东西（因为这可能会触发类加载和重新编译）。

如果您试图比较两个算法，请至少为每个算法执行两个基准测试，交替顺序。i、 e:

for(i=1..n)
  alg1();
for(i=1..n)
  alg2();
for(i=1..n)
  alg2();
for(i=1..n)
  alg1();

我发现同一算法在不同过程中的运行时存在一些明显的差异（有时为5-10%）

另外，请确保n非常大，以便每个循环的运行时间至少为10秒左右。迭代次数越多，基准时间中的数字就越重要，数据也就越可靠。

确保以某种方式使用在基准代码中计算的结果。否则，您的代码可以被优化掉

基准测试应该测量时间/迭代还是迭代/时间，为什么

这取决于您要测试的内容

如果您对延迟感兴趣，请使用时间/迭代；如果您对吞吐量感兴趣，请使用迭代/时间。
有关编写微基准测试的提示：
规则0:阅读一篇关于JVM和微观基准测试的著名论文。一个好的是。不要对微观基准期望过高；它们只测量有限范围的JVM性能特征
规则1:始终包括一个预热阶段，该阶段将一直运行测试内核，足以在计时阶段之前触发所有初始化和编译。（在热身阶段，较少的迭代是可以的。经验法则是数万次内部循环迭代。）
规则2:始终使用
-XX:+printcomilation
、
-verbose:gc
等运行，因此您可以验证编译器和JVM的其他部分在计时阶段没有执行意外的工作
规则2.1:在计时和预热阶段的开始和结束时打印消息，以便您可以验证在计时阶段没有规则2的输出
规则3:注意
-client
和
-server
与OSR和常规编译之间的区别。
-XX:+printcomilation
标志报告OSR编译，并使用at符号表示非初始入口点，例如：
Trouble$1:：run@2（41字节）
。如果您追求最佳性能，则更喜欢服务器而不是客户端，更喜欢常规而不是OSR
规则4:注意初始化效果。不要在计时阶段第一次打印，因为打印会加载和初始化类。不要在预热阶段（或最终报告阶段）之外加载新类，除非您专门测试类加载（在这种情况下，只加载测试类）。规则2是你对抗这些影响的第一道防线
规则5:注意去优化和重新编译的效果。不要在计时阶段第一次使用任何代码路径，因为编译器可能会根据之前的乐观假设（即根本不会使用该路径）垃圾并重新编译代码。规则2是你对抗这些影响的第一道防线
规则6:使用适当的工具来了解编译器的想法，并期望对它生成的代码感到惊讶。在形成关于是什么使事情更快或更慢的理论之前，自己检查代码
规则7:减少测量中的噪音。在一台安静的机器上运行基准测试，并运行几次，丢弃outl
long startTime = System.nanoTime(); //code here... System.out.println("Code took "+(System.nanoTime()-startTime)+"nano seconds");

final long endTime, startTime = System.nanoTime(); //code here... endTime = System.nanoTime(); System.out.println("Code took "+(endTime-startTime)+"nano seconds");