Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/319.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在python中使用urljoin连接URL_Python_Urllib_Urlparse - Fatal编程技术网

在python中使用urljoin连接URL

在python中使用urljoin连接URL,python,urllib,urlparse,Python,Urllib,Urlparse,我试图做一些网页抓取,但我有一些问题,在加入相对和根网址 例如,根url是:http://www.jmlr.org/proceedings/papers/v2 相对url为:../v2/meila07a/meila07a.pdf 当我在urlparse中使用urljoin时:结果很奇怪: http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf 这不是有效的链接。有人能帮我吗?两点。。意味着在层次结构中返回一次,将第二个链接更改为./v2/

我试图做一些网页抓取,但我有一些问题,在加入相对和根网址

例如,根url是:http://www.jmlr.org/proceedings/papers/v2

相对url为:../v2/meila07a/meila07a.pdf

当我在urlparse中使用urljoin时:结果很奇怪:

http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf

这不是有效的链接。有人能帮我吗?

两点。。意味着在层次结构中返回一次,将第二个链接更改为./v2/meila07a/meila07a.pdf,它应该可以正常工作

或者也可以将根目录更改为1http://www.jmlr.org/proceedings/papers/v2/,由于此更改,它将不再在最后处理v2,因为根目录未设置为正确的目录