Regex 使用记事本++;
我想听听是否有人可以帮助我替换我的大XML文件的HTML标记 XML文件有我自己的模式,一切正常。但是我需要删除Regex 使用记事本++;,regex,notepad++,Regex,Notepad++,我想听听是否有人可以帮助我替换我的大XML文件的HTML标记 XML文件有我自己的模式,一切正常。但是我需要删除,和标记中的属性 例如,我需要保留所有、、、和其他标记,但要删除(带属性)、(带属性)和标记中的属性 我试过这个网站和其他网站的很多例子。但大多数都不起作用。引用: 我听说了一些非常好的事情 ,以及使用Python、PHP和 NET分别发布。相信我,用这些 相反 我强烈建议您不要为此使用正则表达式。没有一个理智的正则表达式会起作用,甚至可能接近于起作用。然而,一个像样的XML解析器可以
,
和
标记中的属性
例如,我需要保留所有、- 、、
和其他标记,但要删除
(带属性)、
(带属性)和
标记中的属性
我试过这个网站和其他网站的很多例子。但大多数都不起作用。引用:
我听说了一些非常好的事情
,以及使用Python、PHP和
NET分别发布。相信我,用这些
相反
我强烈建议您不要为此使用正则表达式。没有一个理智的正则表达式会起作用,甚至可能接近于起作用。然而,一个像样的XML解析器可以相当容易地做到这一点。我不确定您可以访问哪些编程语言,但如果您可以使用PHP、.NET或其他编程语言,您可以使用上述解析器查找每个span
、style
、div
和p
,并删除属性或整个标记
jQuery有一些很好的DOM操作功能,如您所描述的,您可以使用它来生成HTML,然后进行剪切和粘贴
如果您绝对必须使用正则表达式,您可以尝试以下方法:
- 模式:
]*?>
- 替换:(无)
- 模式:
]*?>
- 替换: