Python 如何使用BeautifulSoup拾取所需文本?
(我是Python的新手。阅读BeautifulSoup文档,但仍然不知道如何使用它) 我正在尝试使用BeautifulSoup从网页中提取一些信息 网页的HTML源代码包含:Python 如何使用BeautifulSoup拾取所需文本?,python,beautifulsoup,Python,Beautifulsoup,(我是Python的新手。阅读BeautifulSoup文档,但仍然不知道如何使用它) 我正在尝试使用BeautifulSoup从网页中提取一些信息 网页的HTML源代码包含: 我想提取以“http://”开头的网络链接的所有文本,以及数字1015362、1056332、1016552 以下是代码的一部分: AA = soup.findAll(text="http:") for BB in AA: print BB.renderContents() 如何让Bea
我想提取以“http://”开头的网络链接的所有文本,以及数字1015362、1056332、1016552
以下是代码的一部分:
AA = soup.findAll(text="http:")
for BB in AA:
print BB.renderContents()
如何让BeautifulSoup提取所需的文本?用于链接提取
for link in BeautifulSoup(page, parseOnlyThese=SoupStrainer('a')):
if link.has_attr('href'):
print link['href']
text = soup.find('a').gettext()
用于文本提取
for link in BeautifulSoup(page, parseOnlyThese=SoupStrainer('a')):
if link.has_attr('href'):
print link['href']
text = soup.find('a').gettext()
你可以查一查,谢谢雅各布的指导。:)