Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/performance/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 从HTML中提取内容的Jsoup、正则表达式和XPath的性能?_Regex_Performance_Xpath_Jmeter_Jsoup - Fatal编程技术网

Regex 从HTML中提取内容的Jsoup、正则表达式和XPath的性能?

Regex 从HTML中提取内容的Jsoup、正则表达式和XPath的性能?,regex,performance,xpath,jmeter,jsoup,Regex,Performance,Xpath,Jmeter,Jsoup,我知道这是常见的情况 但我想对web应用程序进行性能测试。我确实知道HTML的样子。所以我可以使用正则表达式从页面源代码中提取一些数据 当我进行性能测试(使用Jmeter)时,我希望从主计算机获取更少的资源 什么选项的资源密集度较低:XPath、正则表达式(Jakarta ORO)或Jsoup?从JMeter 2.8开始,答案是Regexp。 但这当然取决于您使用的Regexp表达式。 JMeter中的Regexp实现经过了相当优化,并且是相关的主要后处理方式 关于JSoup,例如需要基于JSR

我知道这是常见的情况

但我想对web应用程序进行性能测试。我确实知道HTML的样子。所以我可以使用正则表达式从页面源代码中提取一些数据

当我进行性能测试(使用Jmeter)时,我希望从主计算机获取更少的资源


什么选项的资源密集度较低:XPath、正则表达式(Jakarta ORO)或Jsoup?

从JMeter 2.8开始,答案是Regexp。 但这当然取决于您使用的Regexp表达式。 JMeter中的Regexp实现经过了相当优化,并且是相关的主要后处理方式

关于JSoup,例如需要基于JSR223后处理器的定制编码

JMeter 2.9将引入一个新的基于CSS/JQuery选择器的提取器,它有两种可能的底层实现:

  • ()

见:

在构建DOM文档时,它的性能将低于Regexp,但它简化了不需要超优化测试计划的测试计划中的许多语法

最后,关于XPath,在它构建DOM树时:

它的内存和CPU成本高于regex,特别是如果您想提取许多元素,则创建了一个增强功能: