使用更改的div id解析html

使用更改的div id解析html,html,parsing,jsoup,Html,Parsing,Jsoup,我正试图解析以下HTML,以便使用jsoup访问我在下面标记的链接: 为此,我做了以下工作: Document doc = Jsoup.parse( url ); Elements links = doc.select(".list-item-wrapper").select(".list-item")----> HERE IM STUCK 我会继续使用: doc.select(".list-item-wrapper").se

我正试图解析以下
HTML
,以便使用
jsoup
访问我在下面标记的链接:

为此,我做了以下工作:

Document doc = Jsoup.parse( url );
Elements links = doc.select(".list-item-wrapper").select(".list-item")----> HERE IM STUCK
我会继续使用:

doc.select(".list-item-wrapper").select(".list-item").select(#SEARCH_RESULT_RECORDID_dedupmrg914683993).select()....
但问题是每页之间都会发生变化

我还尝试:

doc.select(".list-item-wrapper").select(".list-item").select(.list-item-primary-content result-item-primary-content layout-row).select()....
但是我得到了0个结果

如何解析它,以便最终找到
中的链接


谢谢

您可以在任何属性上搜索字符串匹配,如果您的id始终以“搜索结果”和“记录id字符串”开头,则可以使用以下语法查找它

doc.select(".list-item-wrapper").select(".list-item").select('[id^=SEARCH_RESULT_RECORDID]').select()....

我假设选择器使用jquery scheme

如果您提供URL,我们可以检查发生了什么。它可能是一个
加载的页面,因此,如果没有更多步骤,Jsoup将无法使用您的
元素。最重要的是:只要您看到一个HTML页面上有许多以ng-开头的属性,这意味着页面确实包含AngularJava脚本,这意味着web浏览器在最初加载的页面上进行了大量处理。单击浏览器的“查看源代码”按钮时(在上载的图像中)看到的内容与Jsoup最初从web服务器检索到的内容非常不同。Angular JS很难。@Y2020-09你说得太对了,我必须设置一个计时器让页面完全加载,然后我才使用jsoup。
等等。浏览器做了很多Jsoup不会做的处理,不管你等多久…你的意思是在这种情况下使用Jsoup我就不能得到图像吗?所以我尝试使用doc.select(“.list item wrapper”)。select(“.list item”)。select(“[id^=SEARCH\u RESULT\u RECORDID]”。select(“.RESULT item image layout column”)但我不会让我继续做那棵树。它确实让我得到了一些数据,但不是我想做的。