C# Can';不要让正则表达式去掉命名的HTML标记
我有一些html:-C# Can';不要让正则表达式去掉命名的HTML标记,c#,regex,C#,Regex,我有一些html:- <blockquote>This is a quote</blockquote> <p>This is the main post</p> 这是一个报价 这是主要职位 我想删除blockquote及其内容 . 我试过:- string strippedPost = Regex.Replace(post, "<blockquote>(.*?)</blockquote>", ""); string s
<blockquote>This is a quote</blockquote>
<p>This is the main post</p>
这是一个报价
这是主要职位
我想删除blockquote及其内容
. 我试过:-
string strippedPost = Regex.Replace(post, "<blockquote>(.*?)</blockquote>", "");
string strippedPost=Regex.Replace(post,(.*),“”);
但我一点运气都没有。正则表达式有问题吗
更新:也尝试过
string strippedPost = Regex.Replace(post, @"<blockquote>(.*?)<\/blockquote>", "");
string strippedPost=Regex.Replace(post,@“(.*?”,“”);
你能试试这个吗
strippedPost = Regex.Replace(post, "<blockquote>(.|\n)*?</blockquote>", "");
strippedPost=Regex.Replace(post,(.\n)*?,”);
也许是escape/
。我试过了,但除了最琐碎的练习之外,仍然没有任何乐趣。HTML解析器是这项工作的工具;AddRegexOptions可能重复。单线
作为第三个参数。切勿使用(.|\n)*?
。使用RegexOptions.Singleline
启用
以匹配换行符。