Regex 正则表达式不删除html注释?
我有以下字符串:Regex 正则表达式不删除html注释?,regex,vb.net,Regex,Vb.net,我有以下字符串: 6949 我想以以下方式结束: 6949/TD> 但我最终只得到了标签,没有任何信息: <TD></TD> 这是我正在使用的正则表达式: RegEx.Replace("<TD><!-- 1.91 -->6949<!-- 9.11 --></TD>","<!--.*-->","") RegEx.Replace(“6949”、“”、“”) 有人能解释一下如何保留这些数字并删除评论中的内容吗
6949
我想以以下方式结束:
6949/TD>
但我最终只得到了标签,没有任何信息:
<TD></TD>
这是我正在使用的正则表达式:
RegEx.Replace("<TD><!-- 1.91 -->6949<!-- 9.11 --></TD>","<!--.*-->","")
RegEx.Replace(“6949”、“”、“”)
有人能解释一下如何保留这些数字并删除评论中的内容吗。如果可能的话,有人能解释一下为什么会发生这种情况吗?
*
是一个贪婪的限定词,它尽可能匹配。它将匹配所有内容,直到最后一个
-->
将其更改为
*?
,这是一个惰性限定符。*
是贪婪的,因此它将匹配尽可能多的字符。在这种情况下,第一条注释的开头一直持续到第二条注释的结尾。将其更改为*?
或[^>]*
将修复它,因为?
会使匹配延迟。也就是说,它将匹配尽可能少的字符。用正则表达式解析HTML总是很棘手的。取而代之的是,使用类似的工具,可以以结构化的方式查询和解析html。非常感谢。因此,当我使用.*时,它不关心中间是否有任何东西,它一直在继续直到找到最后一个> >并移除其中的每个字符,包括