在htmlunit中过滤外部加载的javascript

在htmlunit中过滤外部加载的javascript,java,javascript,screen-scraping,htmlunit,Java,Javascript,Screen Scraping,Htmlunit,在使用htmlunit刮取网页时,我偶尔会注意到类似这样的警告,这些警告充斥着控制台输出 Jul 24, 2011 5:12:59 PM com.gargoylesoftware.htmlunit.javascript.StrictErrorReporter warning WARNING: warning: message=[Calling eval() with anything other than a primitive string value will simply return

在使用htmlunit刮取网页时,我偶尔会注意到类似这样的警告,这些警告充斥着控制台输出

Jul 24, 2011 5:12:59 PM com.gargoylesoftware.htmlunit.javascript.StrictErrorReporter warning
WARNING: warning: message=[Calling eval() with anything other than a primitive string value 
will simply return the value. Is this what you intended?] sourceName=[http://ad.doubleclick.net/adj/N5762.morningstar.com/B5553006.25;sz=728x90;click0=http://ads.morningstar.com/RealMedia/ads/click_lx.ads/www.morningstar.com/quicktake/fund/L34/648978540/TopLeft/Morningstar/JPM_FRpt_728x90_Jul_3827448/Fund_Reports_728x90_content.html/656d5477595534723465554144664a2b?;ord=648978540?] line=[356] lineSource=[null] lineOffset=[0]
有没有一种方法可以让htmlunit忽略javascript

  • *
  • *
甚至只是


同样,有没有办法让htmlunit只解释包含特定子字符串或匹配正则表达式的网页上的javascript?

您可以通过实现自己的脚本来删除不需要的javascript . 脚本预处理器可以检测到您不想执行的jsvascript,然后将其从网站中删除


我还没有试过,但可能有用。

我不相信你能做到这一点,尽管它听起来确实很有用。对源代码的快速挖掘没有提供任何挂钩。另一种方法是告诉Log4j不要记录这些警告。@Rodney,谢谢你的提示。虽然我在最初的帖子中没有提到这一点,但是过滤javascript也应该提高性能。htmlunit的速度很慢,不需要下载js文件,也不需要执行javascript。我也面临同样的问题