在python中使用urljoin连接URL_Python_Urllib_Urlparse

在python中使用urljoin连接URL

python

在python中使用urljoin连接URL,python,urllib,urlparse,Python,Urllib,Urlparse,我试图做一些网页抓取，但我有一些问题，在加入相对和根网址例如，根url是：http://www.jmlr.org/proceedings/papers/v2 相对url为：../v2/meila07a/meila07a.pdf 当我在urlparse中使用urljoin时：结果很奇怪： http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf 这不是有效的链接。有人能帮我吗？两点。。意味着在层次结构中返回一次，将第二个链接更改为./v2/

我试图做一些网页抓取，但我有一些问题，在加入相对和根网址

例如，根url是：http://www.jmlr.org/proceedings/papers/v2

相对url为：../v2/meila07a/meila07a.pdf

当我在urlparse中使用urljoin时：结果很奇怪：

http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf

这不是有效的链接。有人能帮我吗？

两点。。意味着在层次结构中返回一次，将第二个链接更改为./v2/meila07a/meila07a.pdf，它应该可以正常工作

或者也可以将根目录更改为1http://www.jmlr.org/proceedings/papers/v2/，由于此更改，它将不再在最后处理v2，因为根目录未设置为正确的目录