C# 从html中删除span标记
你能帮我用一个带/不带正则表达式的代码片段从如下字符串中删除所有span标记吗:Silverlight-cC# 从html中删除span标记,c#,html,C#,Html,你能帮我用一个带/不带正则表达式的代码片段从如下字符串中删除所有span标记吗:Silverlight-c <a href="#"> <span class="uiTooltipWrap bottom left leftbottom"> <span class="uiTooltipText"> dasd dssa<br /> adsa sssss </span> </span>
<a href="#">
<span class="uiTooltipWrap bottom left leftbottom">
<span class="uiTooltipText">
dasd dssa<br />
adsa sssss
</span>
</span>
</a>
谢谢。在Perl中,我们可能会说:
s/
< # tag opening character
\/? # optional slash
span
[^>]* # any non tag-closing characters
> # tag closing character
/
# nothing
/x;
我相信你可以把它转换成C正则表达式。也就是说,将与]*>匹配的任何内容替换为零。适合您
这是一个敏捷的HTML解析器,它构建读/写DOM并支持纯XPATH或XSLT。实际上,使用它不需要理解XPATH或XSLT,不用担心。。。。它是一个.NET代码库,允许您解析web HTML文件。解析器对现实世界中格式错误的HTML非常宽容。对象模型与System.Xml非常相似,但适用于HTML文档或流
并尝试htmlagilitypack-删除[regex]标记,因为不应该用正则表达式解析HTML。请参阅Arnis的链接。