Python 如何使用beautifulsoup4从html数据中删除h2标记?
我想删除h2标记,这是我在应用以下脚本删除后得到的。我一直在使用beautifulsoup从网站上获取数据Python 如何使用beautifulsoup4从html数据中删除h2标记?,python,beautifulsoup,Python,Beautifulsoup,我想删除h2标记,这是我在应用以下脚本删除后得到的。我一直在使用beautifulsoup从网站上获取数据 url = 'http://diningdelights.in/Normal-mum.aspx' br = mechanize.Browser() br.open(url) def select_form(form): return form.attrs.get('id', None) == 'form1' br.select_form(predicate=select_form
url = 'http://diningdelights.in/Normal-mum.aspx'
br = mechanize.Browser()
br.open(url)
def select_form(form):
return form.attrs.get('id', None) == 'form1'
br.select_form(predicate=select_form)
br.form.set_all_readonly(False)
br.form["hdnPageSearch"]='3'
br.submit()
soup = BeautifulSoup(br.response().read())
for g_data in soup.find_all("div", class_="innerContainer"):
h2_data=g_data.find_all("h2")
print h2_data
我只是在h2中获取数据。比如说
<h2> Evergreen </h2>, <h2> Evergreen</h2>
常青树,常青树
有人能帮我去掉下面的标签吗 您正在打印元素;如果希望在元素中包含文本,则检索该文本。例如,使用: 您可以使用以下方法简化搜索:
print h2_data.string
for h2_data in soup.select("div.innerContainer h2"):
print h2_data.string