Html 如何使用加特林符号和符号提取href?

Html 如何使用加特林符号和符号提取href?,html,gatling,Html,Gatling,当我需要在Gatling压力测试中跟踪页面上的链接时,如果URL包含符号,则会出现问题。大概是因为盖特林把它解释为一个实体。你怎么能回避这个问题呢 例如: 假设你第一次收到一个包含 <a href="go?to=foobar&index=null" title="Choice 1"> 然后,用于第二个请求的URL是go?to=foobar%E2%88%88dex=null我不确定在HTML属性中使用未替换的符号是否“正确”。但有些网站有,浏览器可以处理。有些网站甚至有&和&

当我需要在Gatling压力测试中跟踪页面上的链接时,如果URL包含符号,则会出现问题。大概是因为盖特林把它解释为一个实体。你怎么能回避这个问题呢

例如:

假设你第一次收到一个包含

<a href="go?to=foobar&index=null" title="Choice 1">
然后,用于第二个请求的URL是
go?to=foobar%E2%88%88dex=null

我不确定在HTML属性中使用未替换的符号是否“正确”。但有些网站有,浏览器可以处理。有些网站甚至有
&
&在同一属性中。但是从2.1.7版开始,Gatling的CSS选择器无法处理普通的(未转换的)符号

如果其他人也有同样的问题,这里有一个肮脏的黑客:

regex("""href="([^"]+)".* title="Choice 1">""")
.transform(raw => raw.replace("&amp;", "&"))
当然,永远不要在HTML(或XML)上使用正则表达式。在这种情况下,绝不意味着“除非它与CSS选择器一起工作”。

这是一个(我们使用的html解析器+CSS选择器实现)

它已经被固定在源代码中,应该很快发布。
然后,强制使用Gatling中的依赖版本。

您使用哪个版本?Gatling-charts-highcharts-bundle-2.1.7编辑答案,因为这是已修复的另一个问题的副本。
regex("""href="([^"]+)".* title="Choice 1">""")
.transform(raw => raw.replace("&amp;", "&"))