什么';vb.NET中的这个正则表达式有什么问题?
我有一个html文本文件,正在尝试删除表中的任何html标记,即删除什么';vb.NET中的这个正则表达式有什么问题?,.net,regex,vb.net,.net,Regex,Vb.net,我有一个html文本文件,正在尝试删除表中的任何html标记,即删除和标记中的任何html 然而,真正奇怪的是我使用的正则表达式, (?如果指定点匹配换行符模式,它在EditPadPro中工作。我看不到你在VB代码中这样做。如果看不到相应的VB代码,很难猜出哪里出了问题。顺便说一句,总的来说,为了可靠地从HTML中提取信息,最好使用HTML解析器(像HTML Agility Pack),因为HTML的语法不是正则的。正则表达式通常被标记器用于解析解决方案,但不是全部。你不应该已经使用正则表达式。
和
标记中的任何html
然而,真正奇怪的是我使用的正则表达式,
(?如果指定点匹配换行符模式,它在EditPadPro中工作。我看不到你在VB代码中这样做。如果看不到相应的VB代码,很难猜出哪里出了问题。顺便说一句,总的来说,为了可靠地从HTML中提取信息,最好使用HTML解析器(像HTML Agility Pack),因为HTML的语法不是正则的。正则表达式通常被标记器用于解析解决方案,但不是全部。你不应该已经使用正则表达式。顺便说一下,检查它们是否相同(比如ignoreCase)。我很确定只有Jon Skeet可以用正则表达式解析HTML。哦,等等,不,他不能
================
texttexetext
<TABLE>
<TAG1>
<TAG2>tabletext<TAG3>
<TAG4>
</TABLE>
texttexttext
===============
================
texttexetext
<TABLE>
tabletext
</TABLE>
texttexttext
===============