Python 如何使用相对路径提取href的绝对URL？_Python_Python 3.x_Web Scraping

Python 如何使用相对路径提取href的绝对URL？

python python-3.x web-scraping

Python 如何使用相对路径提取href的绝对URL？,python,python-3.x,web-scraping,Python,Python 3.x,Web Scraping,我正试图从中提取下载链接以下是该链接的页面来源（在Google Chrome中查看）：当我指向源代码页面上的。/matlab/licensing.pdf时，会出现一个链接https://www.mathworks.com/help/pdf_doc/matlab/licensing.pdf出现我检查了。/matlab/licensing.pdf，但该链接没有显示在右侧。因此，我无法用Python中的regrex提取此链接请帮助我从页面源中提取此链接。尝试使用例如： import url

我正试图从中提取下载链接

以下是该链接的页面来源（在Google Chrome中查看）：

当我指向源代码页面上的

。/matlab/licensing.pdf

时，会出现一个链接

https://www.mathworks.com/help/pdf_doc/matlab/licensing.pdf

出现

我检查了

。/matlab/licensing.pdf

，但该链接没有显示在右侧。因此，我无法用Python中的regrex提取此链接

请帮助我从页面源中提取此链接。

尝试使用

例如：

import urllib.parse
基数=r“https://www.mathworks.com/help/pdf_doc/install/index.html"
链接为“./matlab/licensing.pdf”
result=urllib.parse.urljoin（基本，链接在html中）
打印（结果）

非常感谢您的解决方案！我干得很好。我想询问页面源中是否包含绝对url（我要提取的链接）。@LeAnhDung您可以通过定期检查页面内容的子字符串来实现这一点。但是我怀疑它不会被包含，使用相对路径实际上是一个很好的实践。