Python Regex在另一个属性之后获取属性值
我试图得到一个属性的值,给定前面的文本。假设我有这个:Python Regex在另一个属性之后获取属性值,python,html,regex,Python,Html,Regex,我试图得到一个属性的值,给定前面的文本。假设我有这个: <meta content="firsttag" name="datatoget" /> 我想获得name(datatoget)的值。 我知道特定属性((?强制性:我确信许多解析库都有可爱的getAttribute方法,这些方法会很好地工作。你是在拉一个完整的html页面?还是只有这个字符串?如果你有一个完整的html文档,请看一看html解析器,lxml,漂亮的汤,不,我不是在解析完整的文档,每次都有一些相同的文本,一个
<meta content="firsttag" name="datatoget" />
我想获得name(datatoget)的值。
我知道特定属性((?强制性:我确信许多解析库都有可爱的getAttribute
方法,这些方法会很好地工作。你是在拉一个完整的html页面?还是只有这个字符串?如果你有一个完整的html文档,请看一看html解析器,lxml,漂亮的汤,不,我不是在解析完整的文档,每次都有一些相同的文本,一个d我只需要一个简单的值,所以我认为使用正则表达式会更好。您的做法是正确的,只需使用()
来捕获所需的值content=“firsttag”name=“(.*)”
Regex在这种情况下可能没问题。尽管SO很喜欢链接dm和我链接的答案,但如果字符串是HTML的一小部分,没有嵌套的标记和其他类似的Zalgo调用属性,那么您可以使用Regex解析字符串,这些属性已经让很多开发人员绊倒了。
(?<=name=")[a-zA-Z0-9]*