Python BeautifulSoup是否剥离内联CSS和javascript内容
嘿,伙计们,beautifulSoup会剥离css和javascript内容吗?使用后Python BeautifulSoup是否剥离内联CSS和javascript内容,python,beautifulsoup,Python,Beautifulsoup,嘿,伙计们,beautifulSoup会剥离css和javascript内容吗?使用后 content3 = ''.join(BeautifulSoup(content).findAll(text=True)) 我仍然保留着它们。所有脚本和样式元素,你到底想要去除什么?应该是这样的: ''.join(BeautifulSoup(content).findAll(text=lambda text: text.parent.name != "script" and text.parent.na
content3 = ''.join(BeautifulSoup(content).findAll(text=True))
我仍然保留着它们。所有脚本和样式元素,你到底想要去除什么?应该是这样的:
''.join(BeautifulSoup(content).findAll(text=lambda text:
text.parent.name != "script" and
text.parent.name != "style"))
没错,也许一个正则表达式替换可以做到这一点,但我想知道beautifulsoup是否能处理这一点。或者webstemmer的简单版本也能做到这一点?