Python BeautifulSoup在查找完所有内容后获取href

Python BeautifulSoup在查找完所有内容后获取href,python,beautifulsoup,Python,Beautifulsoup,我正在浏览一个供应商链接目录。我创建了一个soup&使用find_all方法隔离了我想要的所有数据。但是,我需要的字符串嵌套在汤中的更深处。我知道find_all会返回一个列表,但我需要进一步提取列表以获得我需要的内容。谢谢你的帮助,因为我要把我的笔记本电脑扔到房间的另一边。下面是我当前的代码 我对Python有很好的理解,但对BeautifulSoup只有基本的了解 URL = get(https://www......) # importing the url I want to work

我正在浏览一个供应商链接目录。我创建了一个soup&使用find_all方法隔离了我想要的所有数据。但是,我需要的字符串嵌套在汤中的更深处。我知道find_all会返回一个列表,但我需要进一步提取列表以获得我需要的内容。谢谢你的帮助,因为我要把我的笔记本电脑扔到房间的另一边。下面是我当前的代码

我对Python有很好的理解,但对BeautifulSoup只有基本的了解

URL = get(https://www......) # importing the url I want to work over
soup = BeautifulSoup(URL.text, 'html.parser') # making the soup
IsoUrl = soup.find_all('a',class='xmd-listing-company-name') # Isolates the tags of the links I need. 
这或多或少是我陷入困境的地方。从上面的隔离中,我得到了一个由以下内容组成的列表。以下仅是列表中的一项

<a class="xmd-listing-company-name"href="/rated.company.html" itemprop='url><span itemprop='name'>Company</span></a>'
'
列表中有10+个以上的字符串。我想从每个字符串中划出“/rated.company.html”,并将它们附加到列表中进行迭代


非常感谢您的指导。如果我需要澄清任何事情,请让我知道

您只需循环查看
的结果,查找所有内容
并提取href,如下所示:

results = [iso['href'] for iso in IsoUrl]

# >>> ["/rated.company.html", ...]

您只需在
find_all
的结果上循环并提取href,如下所示:

results = [iso['href'] for iso in IsoUrl]

# >>> ["/rated.company.html", ...]

只需添加href=true就可以了。查找所有('a',class='xmd-listing-company-name',href=true)只需添加href=true就可以了。查找所有('a',class='xmd-listing-company-name',href=true)非常感谢。曾经尝试过类似的事情(基于其他论坛),但没有成功。你的方法完全符合我的需要。再次谢谢你,不客气!您离解决方案不远,检查此项了解其他方法非常感谢。曾经尝试过类似的事情(基于其他论坛),但没有成功。你的方法完全符合我的需要。再次谢谢你,不客气!您离解决方案不远,请检查此项以了解其他方法