使用Python从其锚点获取链接

使用Python从其锚点获取链接,python,regex,beautifulsoup,Python,Regex,Beautifulsoup,我有一个URL列表,在其他类型的URL中具有所有相同的锚定“查看页面”,如下所示: <a href="url1" target="_blank">view page</a> <a href="url2" target="_blank">view page</a> 有没有办法用这个特定的锚文本提取所有URL 谢谢要查找文本视图页面的链接,您可以使用查找所有('a',text='view page')然后循环搜索结果集并从中提取url: fro

我有一个URL列表,在其他类型的URL中具有所有相同的锚定“查看页面”,如下所示:

<a href="url1" target="_blank">view page</a>

<a href="url2" target="_blank">view page</a>

有没有办法用这个特定的锚文本提取所有URL

谢谢

要查找文本视图页面的链接,您可以使用
查找所有('a',text='view page')
然后循环搜索结果集并从中提取url:

from bs4 import BeautifulSoup    
soup = BeautifulSoup("""<a href="url1" target="_blank">view page</a>
<a href="url2" target="_blank">view page</a>
<a href="url2" target="_blank"></a>""", "html.parser")

[a['href'] for a in soup.find_all('a', text='view page')]
# [u'url1', u'url2']
从bs4导入美化组
汤=美汤
“,”html.parser“)
[a['href']表示汤中的a。查找所有('a',text='view page')]
#[u'url1',u'url2']