Selenium Python：下载DOM对象指定的PDF_Python_Pdf_Dom_Selenium

Selenium Python：下载DOM对象指定的PDF

python pdf dom selenium

Selenium Python：下载DOM对象指定的PDF,python,pdf,dom,selenium,Python,Pdf,Dom,Selenium,我对selenium是新手，下面是我使用selenium下载日报pdf文档的代码从selenium导入webdriver #Setting the profile profile = webdriver.firefox.firefox_profile.FirefoxProfile() profile.set_preference('browser.helperApps.neverAsk.saveToDisk', ('application/pdf')) profile.set_preferen

我对selenium是新手，下面是我使用selenium下载日报pdf文档的代码从selenium导入webdriver

#Setting the profile
profile = webdriver.firefox.firefox_profile.FirefoxProfile()
profile.set_preference('browser.helperApps.neverAsk.saveToDisk', ('application/pdf'))
profile.set_preference('browser.download.dir',  '/home/jill/Downloads/Dinamalar');
browser = webdriver.Firefox();

browser.get("http://epaper.dinamalar.com/");
webobj = browser.find_element_by_id("liSavePdf");
ob = webobj.click();

ob的值为无。我检查了很多链接，在所有链接中，似乎都有一个明确的“下载pdf”按钮，可以直接下载预期的pdf。在我的情况下，单击“保存PDF”会将我引导到另一个页面，然后需要单击另一个“下载”按钮

我不熟悉DOM对象。“保存PDF”似乎是一个DOM对象。因此，我不知道如何进一步进行

这将返回PDF文件的链接

http://epaper.dinamalar.com/PUBLICATIONS/DM/MADHURAI/2015/05/26/PagePrint//26_05_2015_001_b2b69fda315301809dda359a6d3d9689.pdf

id为

liSavePdf

的元素不是包含

onclick=

属性的元素。它包含一个要单击的

元素：
webobj.find_elements_by_tag_name('a')[0].click()

成功了，我有个问题。当我使用click（）方法时，另一个网站已经打开。如何获取打开的子站点的URL（我需要下载该URL）？我的答案解决了这个问题。页面上有一个javascript函数，用于生成弹出url。我稍微修改了ot，所以您可以直接获得链接。
webobj.find_elements_by_tag_name('a')[0].click()