使用jsoup有没有一种方法可以获取在css类中具有display none样式的class属性的div标记中的锚定标记。。?
我有一个文档,我正试图从中提取a标签。其中一些位于具有class属性的div标记内,并且该类具有display:none属性集。它们不会直接使用div标记中的style属性隐藏。我想消除这些。css包含在使用链接标记的页面中。选择所有标记,然后搜索是否有一个父级是隐藏类:使用jsoup有没有一种方法可以获取在css类中具有display none样式的class属性的div标记中的锚定标记。。?,css,class,styles,jsoup,extract,Css,Class,Styles,Jsoup,Extract,我有一个文档,我正试图从中提取a标签。其中一些位于具有class属性的div标记内,并且该类具有display:none属性集。它们不会直接使用div标记中的style属性隐藏。我想消除这些。css包含在使用链接标记的页面中。选择所有标记,然后搜索是否有一个父级是隐藏类: for (Element a : doc.getElementsByTag("a")) { for (Element parent : a.parents()) { if (parent.tagName
for (Element a : doc.getElementsByTag("a")) {
for (Element parent : a.parents()) {
if (parent.tagName().equals("div") && parent.hasClass("hidden")) {
a.remove();
}
}
}
doc.select("div.hidden a").remove();
或者更简单-只需删除隐藏类中的所有锚点:
for (Element a : doc.getElementsByTag("a")) {
for (Element parent : a.parents()) {
if (parent.tagName().equals("div") && parent.hasClass("hidden")) {
a.remove();
}
}
}
doc.select("div.hidden a").remove();