Python 删除所有空白
我有一个正则表达式,它搜索一个特殊的类并输出一个标记Python 删除所有空白,python,regex,Python,Regex,我有一个正则表达式,它搜索一个特殊的类并输出一个标记 (?<=<div\ class="value.*?">\s+).*?(?=\s+</div>) (?您不需要任何look aheads或look behinds。正确的正则表达式是: '<div class="value.*?">\s+(.*?)\s+</div>' “\s+(.*)\s+” 为什么不使用HTML解析器(如HTML.parser或lxml)或元解析器(如Beautifu
(?<=<div\ class="value.*?">\s+).*?(?=\s+</div>)
(?您不需要任何look aheads或look behinds。正确的正则表达式是:
'<div class="value.*?">\s+(.*?)\s+</div>'
“\s+(.*)\s+”
为什么不使用HTML解析器(如HTML.parser
或lxml
)或元解析器(如BeautifulSoup)将标记内容作为字符串获取,然后只使用strip()
该字符串?而不是(?例如:soup=bs4.BeautifulSoup(text)
,然后使用div=soup.find('div',class=('value','odd'))
,然后text=div.text.strip()
。我知道这可以更容易地完成,但在我的任务中,我只需要使用正则表达式:(您甚至无法编译正则表达式:sre_常量。错误:向后看需要固定宽度的模式
)。
'<div class="value.*?">\s+(.*?)\s+</div>'