Python 未包装的标签仍在那里
我想删除给定标记(节点)下的Python 未包装的标签仍在那里,python,beautifulsoup,bs4,Python,Beautifulsoup,Bs4,我想删除给定标记(节点)下的script和noscript标记 但是上面的循环仍然会打印script标记的内容 故障在哪里?您需要: PageElement.extract()从树中删除标记或字符串 您需要的是: PageElement.extract()从树中删除标记或字符串 您使用了错误的方法。您可以使用该方法来执行此操作,尤其是在不需要返回要删除的标记或字符串的情况下 decompose()从树中删除标记,然后完全销毁它及其内容 您使用了错误的方法。您可以使用该方法来执行此操作,尤其是在不
script
和noscript
标记
但是上面的循环仍然会打印script
标记的内容
故障在哪里?您需要:
PageElement.extract()
从树中删除标记或字符串
您需要的是:
PageElement.extract()
从树中删除标记或字符串
您使用了错误的方法。您可以使用该方法来执行此操作,尤其是在不需要返回要删除的标记或字符串的情况下 decompose()从树中删除标记,然后完全销毁它及其内容
您使用了错误的方法。您可以使用该方法来执行此操作,尤其是在不需要返回要删除的标记或字符串的情况下 decompose()从树中删除标记,然后完全销毁它及其内容
for t in node.find_all(["script", "noscript"]):
t.unwrap()
for s in node.stripped_strings:
print s
for t in node.find_all(["script", "noscript"]):
t.extract()
for t in node.find_all(["script", "noscript"]):
t.decompose()