Python 筛选一份用美味汤制作的网络垃圾的清单

Python 筛选一份用美味汤制作的网络垃圾的清单,python,python-2.7,web-scraping,beautifulsoup,Python,Python 2.7,Web Scraping,Beautifulsoup,我正在使用python编写代码。我一直试图在网站上搜索nba选秀候选人的名字、球队形象和学校。然而,当我搜索学校名称时,我得到了学校页面和学校名称。我怎样才能看到大学?我已经尝试将.string和.text添加到锚点(anchor.string)的末尾 html中锚定的格式是,因此,除非已经有了一个奇特的html解析器库(我敢打赌有,只是不知道有),否则您可能需要使用某种正则表达式来解析所需的锚定部分。而不仅仅是: print anchor 使用: BeautifulSoup是“奇特的html

我正在使用python编写代码。我一直试图在网站上搜索nba选秀候选人的名字、球队形象和学校。然而,当我搜索学校名称时,我得到了学校页面和学校名称。我怎样才能看到大学?我已经尝试将.string和.text添加到锚点(anchor.string)的末尾


html中锚定的格式是
,因此,除非已经有了一个奇特的html解析器库(我敢打赌有,只是不知道有),否则您可能需要使用某种正则表达式来解析所需的锚定部分。

而不仅仅是:

print anchor
使用:


BeautifulSoup是“奇特的html解析器库”。你不能用正则表达式解析HTML。看,谢谢,我得去调查一下美苏。至于regex,我很喜欢读这篇文章,但第二个答案(也是赢得奖金的答案)确实表明,您可以解析有限的已知html子集,我认为findAll会返回该子集。
print anchor
print anchor[0].text