如何在Python中的td标记内获取href值_Python_Beautifulsoup

如何在Python中的td标记内获取href值

python

如何在Python中的td标记内获取href值,python,beautifulsoup,Python,Beautifulsoup,我正在尝试根据td字符串获取td标记内的所有href链接。我成功地获得了所有与BeautifulSoup模块的href链接，但我只对td标记下的href链接感兴趣，其中td类包含特定字符串。是否可以使用BeautifulSoup模块或Python中的任何其他模块提取这些内容 <td title="" class="pass"> <a href="link info"> <div class="fill">

我正在尝试根据

td

字符串获取

td

标记内的所有

href

链接。我成功地获得了所有与BeautifulSoup模块的

href

链接，但我只对

td

标记下的

href

链接感兴趣，其中

td

类包含特定字符串。是否可以使用BeautifulSoup模块或Python中的任何其他模块提取这些内容

      <td title="" class="pass">
          <a href="link info">
            <div class="fill"></div>
          </a>
      </td>

      <td title="" class="fail">
          <a href="inlk">
            <div class="fill"></div>
          </a>
      </td>

      <div class="fill"></div>
   </a>
</td>

我有兴趣获取此网页中的所有

href

链接，其中

td

类为

pass

您可以使用：

这将从页面中的td获取href。希望这对你有用

for link in soup.select('td.pass a[href]'):
    print link['href']

from BeautifulSoup import BeautifulSoup,SoupStrainer
import requests
import re
c_link = 'your_link'
r = requests.get(c_link)
data = r.text
soup = BeautifulSoup(data, parseOnlyThese=SoupStrainer("td"))
x = soup.findAll("a")
for tr in x:
    links = tr.get('href')
    print links