C# 使用c删除html内容中存在的多个span标记#
请为我提供删除c中HTML内容中存在的多个span标记的选项# 例如-C# 使用c删除html内容中存在的多个span标记#,c#,html,.net,C#,Html,.net,请为我提供删除c中HTML内容中存在的多个span标记的选项# 例如-Welcometo C# 输出-欢迎使用C您可以使用正则表达式:regex.Replace(content,”,string.Empty)在C#中使用Html时,HtmlAgilityPack通常是一种方法: private static void Main() { HtmlDocument html = new HtmlDocument(); html.LoadHtml(@"<span style=
Welcometo C#
输出-
欢迎使用C
您可以使用正则表达式:regex.Replace(content,”,string.Empty)代码>在C#中使用Html时,HtmlAgilityPack通常是一种方法:
private static void Main()
{
HtmlDocument html = new HtmlDocument();
html.LoadHtml(@"<span style=""abc"">Welcome</span><span style=""xyz"">to C#</span>");
Console.WriteLine(html.DocumentNode.InnerText);
Console.Read();
}
private static void Main()
{
HtmlDocument html=新的HtmlDocument();
html.LoadHtml(@“Welcometo C#”);
WriteLine(html.DocumentNode.InnerText);
Console.Read();
}
您可以从Nuget获取HtmlAgilityPack。使用正则表达式,您可以使用以下方法删除span标记:
Regex.Replace(content, "<[/]?span[^>]*?>", string.Empty);
Regex.Replace(内容“]*?>”,string.Empty);
但这将产生类似Welcometo C#的结果,如果需要保留空间,则需要捕获组并用空间替换它们:
var content = @"<span style=""abc"">Welcome</span><span style=""xyz"">to C#</span>";
Regex regE = new Regex("<span[^>]*?>(.*?)</span>", RegexOptions.Singleline);
var matches = regE.Matches(content);
foreach (Match m in matches)
{
if (m.Success)
content = content.Replace(m.Groups[0].Value, m.Groups[1].Value + " ");
}
content = content.Trim();
var content=@“Welcometo C#”;
Regex regE=new Regex(“]*?>(.*?”),RegexOptions.Singleline);
var matches=regE.matches(内容);
foreach(匹配中的匹配m)
{
如果(m.成功)
content=content.Replace(m.Groups[0]。Value,m.Groups[1]。Value+“”);
}
content=content.Trim();