Python BeautifulSoup在查找完所有内容后获取href_Python_Beautifulsoup

Python BeautifulSoup在查找完所有内容后获取href

python

Python BeautifulSoup在查找完所有内容后获取href,python,beautifulsoup,Python,Beautifulsoup,我正在浏览一个供应商链接目录。我创建了一个soup&使用find_all方法隔离了我想要的所有数据。但是，我需要的字符串嵌套在汤中的更深处。我知道find_all会返回一个列表，但我需要进一步提取列表以获得我需要的内容。谢谢你的帮助，因为我要把我的笔记本电脑扔到房间的另一边。下面是我当前的代码我对Python有很好的理解，但对BeautifulSoup只有基本的了解 URL = get(https://www......) # importing the url I want to work

我正在浏览一个供应商链接目录。我创建了一个soup&使用find_all方法隔离了我想要的所有数据。但是，我需要的字符串嵌套在汤中的更深处。我知道find_all会返回一个列表，但我需要进一步提取列表以获得我需要的内容。谢谢你的帮助，因为我要把我的笔记本电脑扔到房间的另一边。下面是我当前的代码

我对Python有很好的理解，但对BeautifulSoup只有基本的了解

URL = get(https://www......) # importing the url I want to work over
soup = BeautifulSoup(URL.text, 'html.parser') # making the soup
IsoUrl = soup.find_all('a',class='xmd-listing-company-name') # Isolates the tags of the links I need.

这或多或少是我陷入困境的地方。从上面的隔离中，我得到了一个由以下内容组成的列表。以下仅是列表中的一项

<a class="xmd-listing-company-name"href="/rated.company.html" itemprop='url><span itemprop='name'>Company</span></a>'

列表中有10+个以上的字符串。我想从每个字符串中划出“/rated.company.html”，并将它们附加到列表中进行迭代

非常感谢您的指导。如果我需要澄清任何事情，请让我知道

您只需循环查看

的结果，查找所有内容

并提取href，如下所示：

results = [iso['href'] for iso in IsoUrl]

# >>> ["/rated.company.html", ...]

您只需在

find_all

的结果上循环并提取href，如下所示：

results = [iso['href'] for iso in IsoUrl]

# >>> ["/rated.company.html", ...]

只需添加href=true就可以了。查找所有（'a'，class='xmd-listing-company-name'，href=true）只需添加href=true就可以了。查找所有（'a'，class='xmd-listing-company-name'，href=true）非常感谢。曾经尝试过类似的事情（基于其他论坛），但没有成功。你的方法完全符合我的需要。再次谢谢你，不客气！您离解决方案不远，检查此项了解其他方法非常感谢。曾经尝试过类似的事情（基于其他论坛），但没有成功。你的方法完全符合我的需要。再次谢谢你，不客气！您离解决方案不远，请检查此项以了解其他方法