Java 如何选择一组特定的<;p>;带有jsoup的标记

Java 如何选择一组特定的<;p>;带有jsoup的标记,java,jsoup,Java,Jsoup,我正试图解析以下HTML代码 有人能告诉我如何只选择框中的p标签吗。 或者有人能告诉我如何移除红线下的标签吗?此外,在中还有大量不需要的p标记 div class=“SPOSTARBUST相关职位” 但是 似乎什么都不做您应该使用以下选择器 div[id=content] > p 像这样 final String html = "<head><body/><div id=\"content\"><p>a</p><

我正试图解析以下HTML代码

有人能告诉我如何只选择框中的p标签吗。 或者有人能告诉我如何移除红线下的标签吗?此外,在中还有大量不需要的p标记

div class=“SPOSTARBUST相关职位”

但是


似乎什么都不做

您应该使用以下选择器

div[id=content] > p
像这样

    final String html = "<head><body/><div id=\"content\"><p>a</p><p>b</p><div><p>v</p></div></div></html>";
    final Document doc = Jsoup.parse(html);

    final Elements ps = doc.select("div[id=content] > p");
    System.out.println(ps.size());
Elements paragraphs = doc.select("p[style*=justify]");
final String html=“a

b

v

”; 最终文档doc=Jsoup.parse(html); 最终元素ps=doc.select(“div[id=content]>p”); System.out.println(ps.size());

如果您只想选择红色框中的
标记,这将返回
div[id=“content”]
的所有直接
p
子项,因为您可以看到唯一可以找到的标准是
style=“text align:justify”

你可以这样做

Elements paragraphs = doc.select("p[style*=justify]");

但我不想让所有的“p”字孩子都知道我会把这和亚历克斯的答案结合起来@Lai我只是举了一个例子,因为一方面您想删除行下方的
p
标记,另一方面在
div
标记中您的选择上方有一个
p
标记。那么你的标准到底是什么呢?我会将其与ShyJ的答案结合起来。谢谢,这似乎是一个解决方案,但如果你注意到,在高亮框区域上方仍然有一个不需要的

..