python selenium bs4,不是从https url下载图像,而是从src和server dir下载图像
我想从网站自动下载一些图片 我终于找到了图片的srcpython selenium bs4,不是从https url下载图像,而是从src和server dir下载图像,python,selenium,beautifulsoup,Python,Selenium,Beautifulsoup,我想从网站自动下载一些图片 我终于找到了图片的src html = driver.page_source soup = BeautifulSoup(html, 'html.parser') td_soup = soup.find('td', {'colspan' : '8'}) src = td_soup.find('img').get('src') 但问题是,当我打印(src)时,这就是我得到的 '/CtxApp/resource/6/1566779160637815196.jpg' 一般
html = driver.page_source
soup = BeautifulSoup(html, 'html.parser')
td_soup = soup.find('td', {'colspan' : '8'})
src = td_soup.find('img').get('src')
但问题是,当我打印(src)时,这就是我得到的
'/CtxApp/resource/6/1566779160637815196.jpg'
一般来说,我对web不太了解,但我认为src代表服务器映像目录
在这种情况下,我有没有办法下载这个文件?
我查找了许多关于只下载普通http URL的问题,但不是本例的问题。
如果我尝试按照他们的建议下载该文件,我会得到以下信息
ValueError: unknown url type: '/CtxApp/resource/6/1566779160637815196.jpg'
您需要将基本URL添加到此字符串
base\u url
-拍摄图像的url。例如:base\u url=https://images.unsplash.com
-您希望从此网站拍摄图像。靓汤
返回链接为/photo-1568312442641-d6c790fdf0f6
src = /photo-1568312442641-d6c790fdf0f6
ready_img_link = base_url + src
ready\u img\u链接将https://images.unsplash.com/photo-1568312442641-d6c790fdf0f6
请阅读这篇文章-