正则表达式匹配Python中的特定xml节_Python_Regex

正则表达式匹配Python中的特定xml节

python regex

正则表达式匹配Python中的特定xml节,python,regex,Python,Regex,我想匹配以下标记 <text link="no"> ... </text> 唯一重要的是，我希望将文本元素与link=no作为属性以及其中的任何内容进行匹配我正在使用python，目前我有以下不起作用的正则表达式： '<text [^<]*link="no"[^<]*>[.\t\n\r\xa0]*</text>[ \t\n\r\xa0]*' 所以我认为文本可以有其他属性非常感谢您的帮助使用类似于XML解析器或类似于XP

我想匹配以下标记

<text link="no">
    ...
</text>

唯一重要的是，我希望将文本元素与link=no作为属性以及其中的任何内容进行匹配

我正在使用python，目前我有以下不起作用的正则表达式：

'<text [^<]*link="no"[^<]*>[.\t\n\r\xa0]*</text>[ \t\n\r\xa0]*'

所以我认为文本可以有其他属性

非常感谢您的帮助

使用类似于XML解析器或类似于XPath的XML解析器：

//text[@link="no"]

为什么不使用XML解析库呢？将这个链接放在这里是一个非常传统的做法：你不能用正则表达式解析[X]HTML：好的，所以我想我必须使用解析库…让我们看看pyparsing提供了什么…Thx用于你的响应