使用正则表达式删除C#中的空Html属性
我有一些html,如下所示:使用正则表达式删除C#中的空Html属性,c#,html,regex,C#,Html,Regex,我有一些html,如下所示: <img src="/web/20110208042711im_/http://coralifeaqualight.com/wp-content/themes/xtheme/images/coralife-aqualight-pro.png" alt=""> 我希望能够使用正则表达式清除任何没有值的html属性,在本例中为:alt=”“。 我不知道如何查找任何带有空格且包含“”的字符串,因为这对我来说是可行的,有人知道我不是正则表达式天才,但我相信
<img src="/web/20110208042711im_/http://coralifeaqualight.com/wp-content/themes/xtheme/images/coralife-aqualight-pro.png" alt="">
我希望能够使用正则表达式清除任何没有值的html属性,在本例中为:alt=”“。
我不知道如何查找任何带有空格且包含“”的字符串,因为这对我来说是可行的,有人知道我不是正则表达式天才,但我相信
string.Replace(“\s\w+=\”\”\”,string.Empty)
可以,如果你把整个标记都放在一个字符串中。我不是正则表达式天才,但我相信string.Replace(“\s\w+=”\”\“”,String.Empty)
就可以了,如果你把整个标记都放在一个字符串中。用正则表达式解析HTML通常被认为是一个坏主意,因为边缘案例太多了。自己读
一个受欢迎的解决方案是
另请参见关于正则表达式在HTML中的使用的Stackoverflow问题:使用正则表达式解析HTML通常被认为是一个坏主意,因为存在太多的边缘情况。自己读 一个受欢迎的解决方案是 另请参见有关HTML正则表达式用法的Stackoverflow问题: