嵌套节点的xPath表达式

嵌套节点的xPath表达式,xpath,htmlcleaner,Xpath,Htmlcleaner,我试图提出一个复杂的xPath表达式,但我不知道如何实现。假设您有如下HTML: <span> something1 <br> something2 <br> something3 </span> 有些事 什么 有些事 想象一下,有时第二个和随后的“something3”不存在。我想创建一个xPath表达式,该表达式包含所有跨节点及其内容,直到第一个,因此我最终只解析“something1”。我不知

我试图提出一个复杂的xPath表达式,但我不知道如何实现。假设您有如下HTML:

<span>
    something1
    <br>
    something2
    <br>
    something3
</span>

有些事

什么
有些事
想象一下,有时第二个

和随后的“something3”不存在。我想创建一个xPath表达式,该表达式包含所有跨节点及其内容,直到第一个

,因此我最终只解析“something1”。我不知道这是否可能,如果不可能,在解析了所有
节点之后,是否有人知道一种方法来获得它

我必须说,我正在使用HtmlParser,这是一个Java库,它解析HTML并支持xPath表达式

谢谢


马西娅

你对这个问题的描述让我有点困惑,但听起来有点像

//span/br[1]/preceding-sibling::text()

因此,从上面的示例中,您希望xpath返回something1
?是的,实际上something1最好!我们都很困惑,我的朋友:)这听起来或多或少是我在寻找的。非常感谢,很抱歉描述混乱:)。