Java 使用jsoup查找html中包含连字符的精确文本

Java 使用jsoup查找html中包含连字符的精确文本,java,html,css,regex,jsoup,Java,Html,Css,Regex,Jsoup,我有一个HTML文档,其中我需要能够在文档文本中找到可能包含或不包含连字符的精确匹配项。我正在使用Java和Jsoup 例如,HTML文档可以具有以下内容: <li>some text ABCDE some text</li> <li>some text ABCDE-kriterierna some text</li> 问题是我找不到正则表达式/选择器来为输入单词“ABCDE”只找到第一个列表元素。我不能使用regex\sABCDE\s,因为我不

我有一个HTML文档,其中我需要能够在文档文本中找到可能包含或不包含连字符的精确匹配项。我正在使用Java和Jsoup

例如,HTML文档可以具有以下内容:

<li>some text ABCDE some text</li>
<li>some text ABCDE-kriterierna some text</li>
问题是我找不到正则表达式/选择器来为输入单词“ABCDE”只找到第一个列表元素。我不能使用regex
\sABCDE\s
,因为我不能假设周围的空格。 我尝试了以下几点,但都发现了“ABCDE kriterierna”

有什么想法吗?请帮忙

我不能假设周围的空格,因为ABCDE可能是元素中唯一的文本

记住以上情况,有两种情况会发生这种情况

  • ABCDE
    是一个被空格包围的单词。例如:
  • 一些文本ABCDE一些文本

  • ABCDE
    是列表标记中唯一没有空格的单词。例如:
  • ABCDE
  • 正则表达式:
    (?\s])ABCDE(?=[/code>(li标记的闭合角度)或
    \s
    空白

    ABCDE
    将搜索文字


    (=[如果
    ABCDE
    被空格包围,你可以使用
    \s
    而不是
    \b
    @Rahul,不幸的是,情况并非总是如此。我已经更新了问题中的示例。我有一个输入单词列表:当你说单词时,它是在自然语言的上下文中,如英语。然后它应该被空格包围。@Rahul抱歉,糟糕短语。我实际上只是指输入字符串。我不能假设周围的空格,因为ABCDE可能是元素中唯一的文本。
    <li>ABCDE</li>
    <li>ABCDE-kriterierna</li>
    
    :containsOwn(ABCDE-kriterierna)
    
    :matchesOwn(\bABCDE\b)
    :containsOwn(ABCDE)