正则表达式匹配Python中的特定xml节

正则表达式匹配Python中的特定xml节,python,regex,Python,Regex,我想匹配以下标记 <text link="no"> ... </text> 唯一重要的是,我希望将文本元素与link=no作为属性以及其中的任何内容进行匹配 我正在使用python,目前我有以下不起作用的正则表达式: '<text [^<]*link="no"[^<]*>[.\t\n\r\xa0]*</text>[ \t\n\r\xa0]*' 所以我认为文本可以有其他属性 非常感谢您的帮助 使用类似于XML解析器或类似于XP

我想匹配以下标记

<text link="no">
    ...
</text>
唯一重要的是,我希望将文本元素与link=no作为属性以及其中的任何内容进行匹配

我正在使用python,目前我有以下不起作用的正则表达式:

'<text [^<]*link="no"[^<]*>[.\t\n\r\xa0]*</text>[ \t\n\r\xa0]*'
所以我认为文本可以有其他属性

非常感谢您的帮助

使用类似于XML解析器或类似于XPath的XML解析器:

//text[@link="no"]

为什么不使用XML解析库呢?将这个链接放在这里是一个非常传统的做法:你不能用正则表达式解析[X]HTML:好的,所以我想我必须使用解析库…让我们看看pyparsing提供了什么…Thx用于你的响应