Java 使用jquery内容数据提取网页

Java 使用jquery内容数据提取网页,java,jquery,html,dom,jsoup,Java,Jquery,Html,Dom,Jsoup,我需要从特定网站中提取数据,比如说在网站的评论部分。我已经尝试过使用jsoup提取html文本,但是由于comment部分使用jquery,所以它只提取jquery代码,而不是注释文本。有什么解决我问题的建议吗?谢谢您可以使用HTMLUnit呈现包含所有所需内容的页面,然后从build DOMTree中提取数据。如果AJAX不起作用,您可以找到如何处理OOTB的信息。为什么不为此目的使用xsl转换?请将我引向这个问题:找不到声明的字段类org.apache.http.impl.client.Ht

我需要从特定网站中提取数据,比如说在网站的评论部分。我已经尝试过使用jsoup提取html文本,但是由于comment部分使用jquery,所以它只提取jquery代码,而不是注释文本。有什么解决我问题的建议吗?谢谢

您可以使用HTMLUnit呈现包含所有所需内容的页面,然后从build DOMTree中提取数据。如果AJAX不起作用,您可以找到如何处理OOTB的信息。

为什么不为此目的使用xsl转换?请将我引向这个问题:找不到声明的字段类org.apache.http.impl.client.HttpClientBuilder.sslContextthankyou bro它起作用了。现在我要解决我的第一个问题现在你需要等到注释部分被呈现并从中提取数据。呈现每个javascripts dude时都会有很多错误,即使我设置ThroweExceptionOnFailingStatusCode(false)和ThroweExceptionOnScriptError(false)它只是捕捉到错误,代码也不会显示js的结果。在真实浏览器中渲染时是否也存在js异常?