在python中使用urljoin连接URL
我试图做一些网页抓取,但我有一些问题,在加入相对和根网址 例如,根url是:http://www.jmlr.org/proceedings/papers/v2 相对url为:../v2/meila07a/meila07a.pdf 当我在urlparse中使用urljoin时:结果很奇怪: http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf 这不是有效的链接。有人能帮我吗?两点。。意味着在层次结构中返回一次,将第二个链接更改为./v2/meila07a/meila07a.pdf,它应该可以正常工作 或者也可以将根目录更改为1http://www.jmlr.org/proceedings/papers/v2/,由于此更改,它将不再在最后处理v2,因为根目录未设置为正确的目录在python中使用urljoin连接URL,python,urllib,urlparse,Python,Urllib,Urlparse,我试图做一些网页抓取,但我有一些问题,在加入相对和根网址 例如,根url是:http://www.jmlr.org/proceedings/papers/v2 相对url为:../v2/meila07a/meila07a.pdf 当我在urlparse中使用urljoin时:结果很奇怪: http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf 这不是有效的链接。有人能帮我吗?两点。。意味着在层次结构中返回一次,将第二个链接更改为./v2/