Python 如何使用BeautifulSoup拾取所需文本？_Python_Beautifulsoup

Python 如何使用BeautifulSoup拾取所需文本？

python

Python 如何使用BeautifulSoup拾取所需文本？,python,beautifulsoup,Python,Beautifulsoup,（我是Python的新手。阅读BeautifulSoup文档，但仍然不知道如何使用它）我正在尝试使用BeautifulSoup从网页中提取一些信息网页的HTML源代码包含：我想提取以“http://”开头的网络链接的所有文本，以及数字1015362、1056332、1016552 以下是代码的一部分： AA = soup.findAll(text="http:") for BB in AA: print BB.renderContents() 如何让Bea

（我是Python的新手。阅读BeautifulSoup文档，但仍然不知道如何使用它）

我正在尝试使用BeautifulSoup从网页中提取一些信息

网页的HTML源代码包含：

我想提取以“http://”开头的网络链接的所有文本，以及数字1015362、1056332、1016552

以下是代码的一部分：

AA = soup.findAll(text="http:")
for BB in AA:
    print BB.renderContents()

如何让BeautifulSoup提取所需的文本？

用于链接提取

for link in BeautifulSoup(page, parseOnlyThese=SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']

text = soup.find('a').gettext()

用于文本提取

for link in BeautifulSoup(page, parseOnlyThese=SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']

text = soup.find('a').gettext()

你可以查一查，谢谢雅各布的指导。：）