Python 如何使用BeautifulSoup从锚定标记中提取href链接？_Python_Python 3.x_Beautifulsoup

Python 如何使用BeautifulSoup从锚定标记中提取href链接？

python python-3.x

Python 如何使用BeautifulSoup从锚定标记中提取href链接？,python,python-3.x,beautifulsoup,Python,Python 3.x,Beautifulsoup,我一直在尝试提取每个页面上与作业对应的链接。但由于某些原因，当我执行脚本时，它们不会打印。没有错误发生。对于输入，我分别输入了工程部和多伦多。这是我的密码 import requests from bs4 import BeautifulSoup import webbrowser jobsearch = input("What type of job?: ") location = input("What is your location: ") url = ("https://ca.in

我一直在尝试提取每个页面上与作业对应的链接。但由于某些原因，当我执行脚本时，它们不会打印。没有错误发生。对于输入，我分别输入了工程部和多伦多。这是我的密码

import requests
from bs4 import BeautifulSoup
import webbrowser

jobsearch = input("What type of job?: ")
location = input("What is your location: ")
url = ("https://ca.indeed.com/jobs?q=" + jobsearch + "&l=" + location)

r = requests.get(url)
rcontent = r.content
prettify = BeautifulSoup(rcontent, "html.parser")

all_job_url = []

for tag in prettify.find_all('div', {'data-tn-element':"jobTitle"}):
    for links in tag.find_all('a'):
        print (links['href'])

您应该查找锚

标记。看起来是这样的：

<a class="turnstileLink" data-tn-element="jobTitle" href="/rc/clk?jk=3611ac98c0167102&amp;fccid=459dce363200e1be" ...>Project <b>Engineer</b></a>

您应该查找锚

标记。看起来是这样的：

<a class="turnstileLink" data-tn-element="jobTitle" href="/rc/clk?jk=3611ac98c0167102&amp;fccid=459dce363200e1be" ...>Project <b>Engineer</b></a>

我有一种感觉，你需要使用

attrs

像

一样来修饰标签。find_all（'div'，attrs={'data-tn-element'：“jobTitle}）

@jamesSchinner我试过，像COLDSPEED这样的工作本没有很好的答案。但是值得一试。我觉得你需要像使用

attrs

一样使用

来修饰标签。find_all（'div'，attrs={'data-tn-element'：“jobTitle”}）

@jamesSchinner我试过了，像COLDSPEED这样的工作本没有很好的答案。但值得一试。