Python代码,用于在输入字符串中仅保留一组html标记
我有这样的文字:Python代码,用于在输入字符串中仅保留一组html标记,python,beautifulsoup,Python,Beautifulsoup,我有这样的文字: <div> <script></script> <h1>name</h1> <p> Description </p> <i> italic </i> </div> def strip_tags(text, a_list_of_tags_to_not_remove) 使用下面漂亮的代码,我可以删除所有的html标记,但它不允许保留标记列表,同
<div>
<script></script>
<h1>name</h1>
<p> Description </p>
<i> italic </i>
</div>
def strip_tags(text, a_list_of_tags_to_not_remove)
使用下面漂亮的代码,我可以删除所有的html标记,但它不允许保留标记列表,同时删除其他标记
from bs4 import BeautifulSoup
cleantext = BeautifulSoup(raw_html).text
我可以使用Beautiful Soup或其他python库来执行此操作吗?是的,您可以
您可以使用查找所有不关心的标记,然后在保留内容的同时调用以除去它们。是的,您可以
您可以使用查找所有不关心的标记,然后调用以在保留内容的同时清除它们。您可以使用以下功能:
soup.find_all(['h1', 'p'])
要获得所需标签的列表,无需查找所有不需要的标签。您可以使用以下功能:
soup.find_all(['h1', 'p'])
获取所需标签的列表,而不必查找所有不需要的标签