让Jsoup支持通过JavaScript动态生成的html

让Jsoup支持通过JavaScript动态生成的html,java,javascript,html,jsoup,htmlunit,Java,Javascript,Html,Jsoup,Htmlunit,现在我正在制作一部网络画片。这一个应该解析一些特定的站点,并给我一个xml文件的输出。到目前为止,没有问题。爬虫程序可以工作,您可以通过cfg文件快速定制它。我使用Jsoup解析HTML内容 我刚刚添加了几个站点,并注意到通过JavaScript创建的HTML内容有一个很大的问题。难道没有办法让Jsoup支持Javascript吗?或者至少获取我可以在浏览器中看到的完整HTML内容 我已经试过了,但是这个不行。它没有给我的内容,我会在我的浏览器 诚恳地 Ogofo不支持javascript,也不

现在我正在制作一部网络画片。这一个应该解析一些特定的站点,并给我一个xml文件的输出。到目前为止,没有问题。爬虫程序可以工作,您可以通过cfg文件快速定制它。我使用Jsoup解析HTML内容

我刚刚添加了几个站点,并注意到通过JavaScript创建的HTML内容有一个很大的问题。难道没有办法让Jsoup支持Javascript吗?或者至少获取我可以在浏览器中看到的完整HTML内容

我已经试过了,但是这个不行。它没有给我的内容,我会在我的浏览器

诚恳地


Ogofo不支持javascript,也不模拟浏览器。如果你打算执行Javascript,那就忘了它吧。根据我的经验,HtmlUnit是一种无头浏览器,它给了我最好的结果(总是谈论Java框架)


在HtmlUnit中值得尝试的一件事是在创建
WebClient
实例的同时更改
BrowserVersion
(Chrome/InternetPloer/FireFox)。有些网站会以不同的方式做出反应,有时只要更改该值,就可以得到预期的结果。

Thx。我现在完成了项目的这一部分。HtmlUnit在我给他的网站上运行得不太好。现在我使用phantomjs,我通过java执行它,并将输出wirte放入一个.html文件中。Phantomjs做他的工作,我没有任何错误。我可以在浏览器中查看几乎完全相同的html。是的,phantomjs真的很酷。我没有提到它们,因为您使用的是纯java。您可以查看的另一个选项是zombie.js