Java jsoup-无法获取特定网站

Java jsoup-无法获取特定网站,java,html,dom,jsoup,Java,Html,Dom,Jsoup,我在最新的Eclipse IDE中为Java开发人员使用最新的jsoup(1.13.1)(包括孵化组件) 版本:2020-09(4.17.0) 构建id:20200910-1200 我试图解析一个非常具体的网站,但没有成功。 执行这些行之后: doc=Jsoup.connect(“http://pokehb.pw/%D7%A2%D7%95%D7%A0%D7%94/21/%D7%A4%D7%A8%D7%A7/43).get(); doc.select(“title”).forEach(System

我在最新的Eclipse IDE中为Java开发人员使用最新的jsoup(1.13.1)(包括孵化组件) 版本:2020-09(4.17.0) 构建id:20200910-1200

我试图解析一个非常具体的网站,但没有成功。 执行这些行之后: doc=Jsoup.connect(“http://pokehb.pw/%D7%A2%D7%95%D7%A0%D7%94/21/%D7%A4%D7%A8%D7%A7/43).get(); doc.select(“title”).forEach(System.out::println)

什么都不会被打印出来。 不仅仅是,页面的任何元素或属性都不可用

是的,URL很奇怪,但这是我需要的,我可以在Chrome中很好地浏览它。 我也知道这是由于网站上的希伯来语,因为其他希伯来语网站的作品ok

例如,使用此URL似乎很好:


有什么可以做的吗?

我可以告诉你的是,cookies中有一个“laravel_会话”。这表明您需要一种比JSoup更强大的技术。尝试使用HtmlUnit,它可能会工作。

我最后使用的是以下命令: doc=Jsoup.parse(driver.getPageSource())

它将页面的所有源代码都带到文档中。 从那时起,它就简单地使用了getElementsByClass和getElementsByTag

希望这对某人有所帮助,并感谢Rob尝试回答