Html 如何在正则表达式中过滤单词?

Html 如何在正则表达式中过滤单词?,html,regex,Html,Regex,我不熟悉正则表达式,只需从以下行筛选起始和结束符: <br/><br/><br/><br/><br/><p>hello<br/>asdsadas</p><br/><br/><br/><br/><br/> 你好 我使用的正则表达式如下所示: ^[<br/>]+|[<br/>]+$ ^[]+|[]+$ 但这给了我以

我不熟悉正则表达式,只需从以下行筛选起始和结束符:

<br/><br/><br/><br/><br/><p>hello<br/>asdsadas</p><br/><br/><br/><br/><br/>





你好
我使用的正则表达式如下所示:

^[<br/>]+|[<br/>]+$
^[
]+|[
]+$
但这给了我以下结果:

p>hello<br/>asdsadas</p

p>hello
asdsadas从技术上讲,您的regexp正在搜索任何一个字符,b,r,/独立地,正确的regexp是

^(<br/>)+|(<br/>)+$
^(
)+|(
)+$

但正如我在评论中提到的,尝试使用DOM/XML解析器而不是regexp(Javascript有一个解析器,或者直接使用DOM)

Regex不是选择html的首选方法。但无论如何,请尝试一下:

\<p\>(.*)?\<\/p\>
\(*)\

或者
之间的任何内容都可以不是段落?

如果使用
preg\u match
来分离输入的中间(有趣)片段,则正确的表达式是

^(?:<br/>)*(.*?)(?:<br/>)*$
^(?:
)*(.*)(:
)*$

这将序列

视为单个标记,而在您的示例中使用尖括号意味着“任何字符
”——这就是为什么从
标记中丢失尖括号的原因。

您在开始使用regexp时出错了。。。看看你到底是怎么用的?@SergeS我不明白这个答案,而且它也被锁上了。如果你知道怎么做,请告诉我。请举个例子。如果你不知道,让我们都等着聪明人出现。lol@Jon我只想过滤掉那一行,以得到所需的结果。我将在一个框架中使用它,但这并不相关。@SergeS:我同意一般不使用正则表达式来解析DOM,但在这里不这样做。从输入端修剪一个特定的子字符串(没有真正解析

s)不需要DOM。我使用的是java,因此正则表达式就足够了,我将接受您的回答,我只需要再等3分钟。但看起来你是解决这个问题的智者。做得好。
^(?:<br/>)*(.*?)(?:<br/>)*$