如何删除文本内容中的固定XML标记?

如何删除文本内容中的固定XML标记?,xml,regex,word,Xml,Regex,Word,我有包含以下内容的xml文件: Hello <Images> <URL>google</URL> </Images> <Reviews> Good </Reviews> everybody, <Images> <URL>bing</URL> </Images> <Reviews> Good </Reviews> I am Nguyen 如何删除和之间

我有包含以下内容的xml文件:

Hello
<Images>
<URL>google</URL>
</Images>
<Reviews>
Good
</Reviews>
everybody,

<Images>
<URL>bing</URL>
</Images>
<Reviews>
Good
</Reviews>
I am Nguyen
如何删除
之间的内容


上面的示例数据很小。实际上,我有一个大数据。

你可以用一个空格替换
(?:\s*+?\s*)+
。如果您使用的正则表达式风格不支持dot-all(表示所有字符的点,包括换行符),则必须将其变得更复杂一些:
(?:\s*(?:。\s*)+?\\s*)+
在JavaScript中工作。

如前所述,您不应该尝试用正则表达式解析XML或HTML。你会惨败的。相反,使用XML解析器。@RobI如果你说的不对,那不是“你会失败得很惨”,而是“你可能会失败得很惨”;)如果内容足够静态,可以使用regex。我以前在一些数据文件上做过。当然,你必须确定你正在使用的内容。
Hello everybody, I am Nguyen