Java 在每个第一个HttpRequest中使用HTMLUnit是个坏主意吗?

Java 在每个第一个HttpRequest中使用HTMLUnit是个坏主意吗?,java,javascript,ajax,htmlunit,web-crawler,Java,Javascript,Ajax,Htmlunit,Web Crawler,我的java后端有一个ajax前端,为了让爬行和HTML5pushState工作,我将使用HtmlUnit在每个第一个请求中处理javascript 我可以通过一个过滤器来解决问题,避免使用HtmlUnit试图降低服务器负载 不管浏览器兼容性如何,哪一个最适合服务器?经过大量的研究和测试,我可以看出,在服务器端处理繁重的javascript应用程序不是我的好主意,HtmlUnit是最好的工具,它做得不太好,所以如果您的需求是支持不支持javascript的客户端,因此,选择PHP或其他服务器端脚

我的java后端有一个ajax前端,为了让爬行和
HTML5
pushState工作,我将使用
HtmlUnit
在每个第一个请求中处理javascript

我可以通过一个过滤器来解决问题,避免使用
HtmlUnit
试图降低服务器负载


不管浏览器兼容性如何,哪一个最适合服务器?

经过大量的研究和测试,我可以看出,在服务器端处理繁重的javascript应用程序不是我的好主意,HtmlUnit是最好的工具,它做得不太好,所以如果您的需求是支持不支持javascript的客户端,因此,选择PHP或其他服务器端脚本语言或JSF


在我的案例中,我在JAX-RS中有一个后端,我设法支持HTML5 pushState,而不在服务器端处理javascript,并假设客户端处理javascript,HtmlUnit仍在使用以实现爬网能力。

谷歌推荐这种方法-见,虽然我想这完全取决于你的内容生成量。我所有的内容都是javascript生成的,我只有一个html文件,我在其中插入模板,带有主干和下划线。谷歌的方法是使用hashbang,但我使用的是pushState,这就是问题所在。PushState要求服务器的第一个请求返回经过完全处理的html文件。