Java 如何使用JSOUP从div样式获取文本
如何使用JSOUP获取文本“xxxx”及其urlJava 如何使用JSOUP从div样式获取文本,java,jsoup,Java,Jsoup,如何使用JSOUP获取文本“xxxx”及其url 年份:2015年 语言:非英语 颜色:颜色 问题可能在于样式不需要按特定顺序出现。但是,选择器会固定顺序并列出许多样式。我会尝试识别风格中真正区别链接的部分,并且只使用这一部分。因为我不知道HTML的其余部分,所以我只能猜出有区别的部分是什么。也许是这个 Elements els = doc.select(div[style*=dashed]); 然而,这只是一个猜测。但也许是div的内容使它区别于其他版本?在这种情况下,您可以这样做
- 年份:2015年
- 语言:非英语
- 颜色:颜色
问题可能在于样式不需要按特定顺序出现。但是,选择器会固定顺序并列出许多样式。我会尝试识别风格中真正区别链接的部分,并且只使用这一部分。因为我不知道HTML的其余部分,所以我只能猜出有区别的部分是什么。也许是这个
Elements els = doc.select(div[style*=dashed]);
然而,这只是一个猜测。但也许是div的内容使它区别于其他版本?在这种情况下,您可以这样做:
Elements els = doc.select(div[style]:has(ul));
或者别的什么。如果你想分享更多的HTML,我可以说得更具体。文档中是否有更多你想要避免的href链接,或者为什么要明确指定div的样式标记?上面的HTML只是页面的一部分,页面中有更多的href链接。指定样式标记是此页面中唯一的原因。