Selenium Python:下载DOM对象指定的PDF

Selenium Python:下载DOM对象指定的PDF,python,pdf,dom,selenium,Python,Pdf,Dom,Selenium,我对selenium是新手,下面是我使用selenium下载日报pdf文档的代码 从selenium导入webdriver #Setting the profile profile = webdriver.firefox.firefox_profile.FirefoxProfile() profile.set_preference('browser.helperApps.neverAsk.saveToDisk', ('application/pdf')) profile.set_preferen

我对selenium是新手,下面是我使用selenium下载日报pdf文档的代码 从selenium导入webdriver

#Setting the profile
profile = webdriver.firefox.firefox_profile.FirefoxProfile()
profile.set_preference('browser.helperApps.neverAsk.saveToDisk', ('application/pdf'))
profile.set_preference('browser.download.dir',  '/home/jill/Downloads/Dinamalar');
browser = webdriver.Firefox();

browser.get("http://epaper.dinamalar.com/");
webobj = browser.find_element_by_id("liSavePdf");
ob = webobj.click();
  • ob的值为无。我检查了很多链接,在所有链接中,似乎都有一个明确的“下载pdf”按钮,可以直接下载预期的pdf。在我的情况下,单击“保存PDF”会将我引导到另一个页面,然后需要单击另一个“下载”按钮

  • 我不熟悉DOM对象。“保存PDF”似乎是一个DOM对象。因此,我不知道如何进一步进行

  • 这将返回PDF文件的链接

    http://epaper.dinamalar.com/PUBLICATIONS/DM/MADHURAI/2015/05/26/PagePrint//26_05_2015_001_b2b69fda315301809dda359a6d3d9689.pdf
    
    id为
    liSavePdf
    的元素不是包含
    onclick=
    属性的元素。它包含一个要单击的
    元素:

    webobj.find_elements_by_tag_name('a')[0].click()
    

    成功了,我有个问题。当我使用click()方法时,另一个网站已经打开。如何获取打开的子站点的URL(我需要下载该URL)?我的答案解决了这个问题。页面上有一个javascript函数,用于生成弹出url。我稍微修改了ot,所以您可以直接获得链接。
    webobj.find_elements_by_tag_name('a')[0].click()