Regex 用于识别HTML标记的正则表达式(仅作为正则表达式重复学习练习!!)

Regex 用于识别HTML标记的正则表达式(仅作为正则表达式重复学习练习!!),regex,Regex,我对regex很陌生。这么长时间以来,我都没有用一根10英尺长的杆子去碰它。到目前为止,我已经尽力避免了。但现在一个个人项目促使我学习它 所以我开始了。我正在浏览这里的教程: 目前我在这里: 我的问题是: 教程说将匹配一个HTML标记 但是它是否也会匹配无效的html标记,比如-或? 还有,它如何匹配结束标记 编辑-我的问题非常具体。我指的是一个特定教程中的一个特定示例,以澄清我对重复的理解是否正确。我再次重申,我不关心使用正则表达式进行html解析。从您如何尝试学习正则表达式的角度来看,回答您

我对regex很陌生。这么长时间以来,我都没有用一根10英尺长的杆子去碰它。到目前为止,我已经尽力避免了。但现在一个个人项目促使我学习它

所以我开始了。我正在浏览这里的教程:

目前我在这里:

我的问题是:

教程说
将匹配一个HTML标记

但是它是否也会匹配无效的html标记,比如-
? 还有,它如何匹配结束标记


编辑-我的问题非常具体。我指的是一个特定教程中的一个特定示例,以澄清我对重复的理解是否正确。我再次重申,我不关心使用正则表达式进行html解析。

从您如何尝试学习正则表达式的角度来看,回答您的问题没有任何害处:

1) 是的,它也将匹配无效标记,因为它是任何字母后跟任何零个或多个其他字母或数字的匹配项

2) 它将与结束标记不匹配(必须在其中的某个位置搜索
/

还有一条评论:人们用来在文档中查找html标记的一种方法是查找左括号和右括号的模式,如下所示:

<\/?[^>]*>
]*>
这是一个开始的括号,一个可选的斜杠,(除了结束括号以外的任何东西)-重复,然后是结束括号。当然,我不建议任何人这样做。这只是一个练习

教程说,将匹配一个HTML标记

但是它是否也会匹配无效的html标记,比如-或? 还有,它如何匹配结束标记

是的,这将与
以及
匹配


如果您只想匹配一个字母,后面跟一个可选的单位数,那么您需要匹配
,那么您需要

阅读以下答案:您没有回答我的问题。我没有使用正则表达式来“匹配HTML”。这不是我的目的。我把这当作学习正则表达式的练习。忘掉HTML吧。我的问题是,如果本教程中的示例的目的是匹配-,那么该示例如何正确?它是否也匹配?回答您的问题:是,它将匹配
,并且与结束标记不匹配。@CasparKleijne的可能重复项否不是重复项。我的问题很具体。我在一个特定的教程中引用了一个特定的例子,以澄清我对重复的理解是否正确。再次重申,我不关心用正则表达式解析html。谢谢!这很有帮助。我想人们在没有真正理解被问的问题的情况下,很快就会对问题做出判断。^同意这个特定的话题。在regex/html这件事上有点像唱诗班。你的问题似乎不是传统的(“我试图学习regex是为了刮网络”,是的,我同意这不是正确的方式)。或者这也是另一种正确的方式吗@DS:
可以替换
{0,1}
。当然,这也会匹配