Regex 从HTML中提取内容的Jsoup、正则表达式和XPath的性能？_Regex_Performance_Xpath_Jmeter_Jsoup

Regex 从HTML中提取内容的Jsoup、正则表达式和XPath的性能？

regex performance xpath jmeter

Regex 从HTML中提取内容的Jsoup、正则表达式和XPath的性能？,regex,performance,xpath,jmeter,jsoup,Regex,Performance,Xpath,Jmeter,Jsoup,我知道这是常见的情况但我想对web应用程序进行性能测试。我确实知道HTML的样子。所以我可以使用正则表达式从页面源代码中提取一些数据当我进行性能测试（使用Jmeter）时，我希望从主计算机获取更少的资源什么选项的资源密集度较低：XPath、正则表达式（Jakarta ORO）或Jsoup？从JMeter 2.8开始，答案是Regexp。但这当然取决于您使用的Regexp表达式。 JMeter中的Regexp实现经过了相当优化，并且是相关的主要后处理方式关于JSoup，例如需要基于JSR

我知道这是常见的情况

但我想对web应用程序进行性能测试。我确实知道HTML的样子。所以我可以使用正则表达式从页面源代码中提取一些数据

当我进行性能测试（使用Jmeter）时，我希望从主计算机获取更少的资源

什么选项的资源密集度较低：XPath、正则表达式（Jakarta ORO）或Jsoup？

从JMeter 2.8开始，答案是Regexp。但这当然取决于您使用的Regexp表达式。 JMeter中的Regexp实现经过了相当优化，并且是相关的主要后处理方式

关于JSoup，例如需要基于JSR223后处理器的定制编码

JMeter 2.9将引入一个新的基于CSS/JQuery选择器的提取器，它有两种可能的底层实现：

（）

见：

在构建DOM文档时，它的性能将低于Regexp，但它简化了不需要超优化测试计划的测试计划中的许多语法

最后，关于XPath，在它构建DOM树时：

它的内存和CPU成本高于regex，特别是如果您想提取许多元素，则创建了一个增强功能：