Python 如何使用相对路径提取href的绝对URL?

Python 如何使用相对路径提取href的绝对URL?,python,python-3.x,web-scraping,Python,Python 3.x,Web Scraping,我正试图从中提取下载链接 以下是该链接的页面来源(在Google Chrome中查看): 当我指向源代码页面上的。/matlab/licensing.pdf时,会出现一个链接https://www.mathworks.com/help/pdf_doc/matlab/licensing.pdf出现 我检查了。/matlab/licensing.pdf,但该链接没有显示在右侧。因此,我无法用Python中的regrex提取此链接 请帮助我从页面源中提取此链接。尝试使用 例如: import url

我正试图从中提取下载链接

以下是该链接的页面来源(在Google Chrome中查看):

当我指向源代码页面上的
。/matlab/licensing.pdf
时,会出现一个链接
https://www.mathworks.com/help/pdf_doc/matlab/licensing.pdf
出现

我检查了
。/matlab/licensing.pdf
,但该链接没有显示在右侧。因此,我无法用Python中的regrex提取此链接

请帮助我从页面源中提取此链接。

尝试使用

例如:

import urllib.parse
基数=r“https://www.mathworks.com/help/pdf_doc/install/index.html"
链接为“./matlab/licensing.pdf”
result=urllib.parse.urljoin(基本,链接在html中)
打印(结果)

非常感谢您的解决方案!我干得很好。我想询问页面源中是否包含绝对url(我要提取的链接)。@LeAnhDung您可以通过定期检查页面内容的子字符串来实现这一点。但是我怀疑它不会被包含,使用相对路径实际上是一个很好的实践。