Python 如何使用BeautifulSoup从锚定标记中提取href链接?
我一直在尝试提取每个页面上与作业对应的链接。但由于某些原因,当我执行脚本时,它们不会打印。没有错误发生。 对于输入,我分别输入了工程部和多伦多。这是我的密码Python 如何使用BeautifulSoup从锚定标记中提取href链接?,python,python-3.x,beautifulsoup,Python,Python 3.x,Beautifulsoup,我一直在尝试提取每个页面上与作业对应的链接。但由于某些原因,当我执行脚本时,它们不会打印。没有错误发生。 对于输入,我分别输入了工程部和多伦多。这是我的密码 import requests from bs4 import BeautifulSoup import webbrowser jobsearch = input("What type of job?: ") location = input("What is your location: ") url = ("https://ca.in
import requests
from bs4 import BeautifulSoup
import webbrowser
jobsearch = input("What type of job?: ")
location = input("What is your location: ")
url = ("https://ca.indeed.com/jobs?q=" + jobsearch + "&l=" + location)
r = requests.get(url)
rcontent = r.content
prettify = BeautifulSoup(rcontent, "html.parser")
all_job_url = []
for tag in prettify.find_all('div', {'data-tn-element':"jobTitle"}):
for links in tag.find_all('a'):
print (links['href'])
您应该查找锚
a
标记。看起来是这样的:
<a class="turnstileLink" data-tn-element="jobTitle" href="/rc/clk?jk=3611ac98c0167102&fccid=459dce363200e1be" ...>Project <b>Engineer</b></a>
您应该查找锚
a
标记。看起来是这样的:
<a class="turnstileLink" data-tn-element="jobTitle" href="/rc/clk?jk=3611ac98c0167102&fccid=459dce363200e1be" ...>Project <b>Engineer</b></a>
我有一种感觉,你需要使用
attrs
像一样来修饰标签。find_all('div',attrs={'data-tn-element':“jobTitle})
@jamesSchinner我试过,像COLDSPEED这样的工作本没有很好的答案。但是值得一试。我觉得你需要像使用attrs
一样使用来修饰标签。find_all('div',attrs={'data-tn-element':“jobTitle”})
@jamesSchinner我试过了,像COLDSPEED这样的工作本没有很好的答案。但值得一试。