Selenium Python:下载DOM对象指定的PDF
我对selenium是新手,下面是我使用selenium下载日报pdf文档的代码 从selenium导入webdriverSelenium Python:下载DOM对象指定的PDF,python,pdf,dom,selenium,Python,Pdf,Dom,Selenium,我对selenium是新手,下面是我使用selenium下载日报pdf文档的代码 从selenium导入webdriver #Setting the profile profile = webdriver.firefox.firefox_profile.FirefoxProfile() profile.set_preference('browser.helperApps.neverAsk.saveToDisk', ('application/pdf')) profile.set_preferen
#Setting the profile
profile = webdriver.firefox.firefox_profile.FirefoxProfile()
profile.set_preference('browser.helperApps.neverAsk.saveToDisk', ('application/pdf'))
profile.set_preference('browser.download.dir', '/home/jill/Downloads/Dinamalar');
browser = webdriver.Firefox();
browser.get("http://epaper.dinamalar.com/");
webobj = browser.find_element_by_id("liSavePdf");
ob = webobj.click();
http://epaper.dinamalar.com/PUBLICATIONS/DM/MADHURAI/2015/05/26/PagePrint//26_05_2015_001_b2b69fda315301809dda359a6d3d9689.pdf
id为liSavePdf
的元素不是包含onclick=
属性的元素。它包含一个要单击的元素:
webobj.find_elements_by_tag_name('a')[0].click()
成功了,我有个问题。当我使用click()方法时,另一个网站已经打开。如何获取打开的子站点的URL(我需要下载该URL)?我的答案解决了这个问题。页面上有一个javascript函数,用于生成弹出url。我稍微修改了ot,所以您可以直接获得链接。
webobj.find_elements_by_tag_name('a')[0].click()