C# 剥离特定标记的Html
我有一个html字符串:C# 剥离特定标记的Html,c#,asp.net,html,regex,C#,Asp.net,Html,Regex,我有一个html字符串: <td style=\"border-bottom: windowtext 1pt solid; border-left: windowtext 1pt solid; padding-bottom: 0cm; padding-left: 3.5pt; width: 489pt; padding-right: 3.5pt; background: #dfdfdf; border-top: windowtext 1pt solid; border-
<td style=\"border-bottom: windowtext 1pt solid;
border-left:
windowtext 1pt solid;
padding-bottom: 0cm;
padding-left: 3.5pt;
width: 489pt;
padding-right: 3.5pt;
background: #dfdfdf;
border-top:
windowtext 1pt solid;
border-right: windowtext 1pt solid;
padding-top: 0cm;\" valign=\"top\" colspan=\"4\">
<strong>Kan fejlen genskabes?</strong>
</td>\r\n
\r\n
我有一段代码,上面有一些特定的标签:
public string HtmlStrip( string input)
{
string acceptable = "img|n|br|tr|td|table|tbody|th|td style strong";
string stringPattern = @"</?(?(?=" + acceptable + @")notag|[a-zA-Z0-9]+)(?:\s[a-zA-Z0-9\-]+=?(?:(["",']?).*?\1?)?)*\s*/?>";
return Regex.Replace(input, stringPattern,String.Empty);
}
公共字符串HtmlStrip(字符串输入)
{
字符串可接受=“img | n | br | tr | td | table | tbody | th | td style strong”;
string stringPattern=@“(如果html
和regex
被添加为标记,那么它确实应该自动添加),也许这可以帮助您