Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/313.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使用BeautifulSoup拾取所需文本?_Python_Beautifulsoup - Fatal编程技术网

Python 如何使用BeautifulSoup拾取所需文本?

Python 如何使用BeautifulSoup拾取所需文本?,python,beautifulsoup,Python,Beautifulsoup,(我是Python的新手。阅读BeautifulSoup文档,但仍然不知道如何使用它) 我正在尝试使用BeautifulSoup从网页中提取一些信息 网页的HTML源代码包含: 我想提取以“http://”开头的网络链接的所有文本,以及数字1015362、1056332、1016552 以下是代码的一部分: AA = soup.findAll(text="http:") for BB in AA: print BB.renderContents() 如何让Bea

(我是Python的新手。阅读BeautifulSoup文档,但仍然不知道如何使用它)

我正在尝试使用BeautifulSoup从网页中提取一些信息

网页的HTML源代码包含:


我想提取以“http://”开头的网络链接的所有文本,以及数字1015362、1056332、1016552

以下是代码的一部分:

AA = soup.findAll(text="http:")
for BB in AA:
    print BB.renderContents()
如何让BeautifulSoup提取所需的文本?

用于链接提取

for link in BeautifulSoup(page, parseOnlyThese=SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']
text = soup.find('a').gettext()
用于文本提取

for link in BeautifulSoup(page, parseOnlyThese=SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']
text = soup.find('a').gettext()

你可以查一查,谢谢雅各布的指导。:)