Java 使用jSoup查找具有特定文本的节点

Java 使用jSoup查找具有特定文本的节点,java,xpath,jsoup,Java,Xpath,Jsoup,如何使用jSoup在节点中找到此HTML片段: <span style="font-weight: bold">Party Date:</span> 14.08.2012<br> 聚会日期:2012年8月14日 我想从HTML片段中提取日期。问题是,这个HTML片段可能出现在元素中的任何位置,因此我需要使用包含的文本来匹配它。由于您已将问题标记为“xpath”,我假设您将接受xpath解决方案。如果没有相反的信息,我将作出一些合理的假设。如果您想更正或完善

如何使用jSoup在节点中找到此HTML片段:

<span style="font-weight: bold">Party Date:</span> 14.08.2012<br>
聚会日期:2012年8月14日

我想从HTML片段中提取日期。问题是,这个HTML片段可能出现在元素中的任何位置,因此我需要使用包含的文本来匹配它。

由于您已将问题标记为“xpath”,我假设您将接受xpath解决方案。如果没有相反的信息,我将作出一些合理的假设。如果您想更正或完善这些假设,请告知我们

假设
  • 文档中正好有一个span元素,文本值为“Party Date:”
  • “Part Date:”文本与原样完全相同。不带前导或尾随空格,也不带大小写变化
  • 所述跨度后面的文本节点包含目标值
  • 所述跨度元素可以出现在文档中的任何位置
  • 样式属性对问题无关紧要
  • XPath表达式 以下XPATH表达式

    //span[.='Party Date:'][1]/following-sibling::text()
    
    …返回

    ' 14.08.2012'
    

    注意:如果您仍在寻找jsoup选择器查询,则这在XPATH 1.0和XPATH 2.0中都有效。。这对我有用

        String html = "<span style=\"font-weight: bold\">Party Date:</span> 14.08.2012<br>";
    
        System.out.println("Date " + Jsoup.parse(html).select("span:matchesOwn(Party Date:)").first().nextSibling().toString());
    
    String html=“聚会日期:2012年8月14日
    ”; System.out.println(“Date”+Jsoup.parse(html).select(“span:matchesOwn(Party Date:)”)).first().nextSibling().toString());
    span(最接近的包装物)的包装物是什么?此
    span
    以及许多其他
    span
    s(没有特定顺序)包含在
    p
    标记中。这就是你想知道的吗?有没有带有class或id属性的包装器?我正在遍历页面中包含class
    entry clearfix
    的所有
    div
    s。每个
    div
    s将包含其中一个
    span
    记录,其中包含文本“Release Date:”。您不能解析
    e.text()
    e.ownText()
    其中e是当前迭代的div吗?