Html 使用BeautifulSoup4从标记获取标题属性
假设如下:Html 使用BeautifulSoup4从标记获取标题属性,html,python-3.x,beautifulsoup,Html,Python 3.x,Beautifulsoup,假设如下: <a href="/wiki/Shanar" title="Shanar">I WANT THIS TEXT</a> 通过打印td我可以看到我找到了正确的行,但我真的不确定如何将文本内部标记为标记。我曾尝试使用print(td.text),但我在这样做时出错,所以很明显我做错了什么 任何建议都将不胜感激 这个呢: import bs4 markup = """ <a href="/wiki/Shanar" title="Shanar">I WA
<a href="/wiki/Shanar" title="Shanar">I WANT THIS TEXT</a>
通过打印td
我可以看到我找到了正确的行,但我真的不确定如何将文本内部标记为标记。我曾尝试使用print(td.text)
,但我在这样做时出错,所以很明显我做错了什么
任何建议都将不胜感激 这个呢:
import bs4
markup = """
<a href="/wiki/Shanar" title="Shanar">I WANT THIS TEXT</a>
"""
soup = bs4.BeautifulSoup(markup=markup)
a = soup.find('a')
print("inner: %s" % a.text)
print("title: %s" % a.attrs["title"])
那么这个呢:
import bs4
markup = """
<a href="/wiki/Shanar" title="Shanar">I WANT THIS TEXT</a>
"""
soup = bs4.BeautifulSoup(markup=markup)
a = soup.find('a')
print("inner: %s" % a.text)
print("title: %s" % a.attrs["title"])
inner: I WANT THIS TEXT
title: Shanar