Python 3.x Selenium python webscraper-如何仅选择网页列表中更改的第一个文档?
所以,我写了大部分的webscraper,但有一件事我不知道怎么做,那就是从这个网站的文档列表中选择最上面/第一个pdf文档。新的PDF应该每月添加到相应年度文件夹的顶部。通常,我会通过xpath选择文档并以这种方式下载,但我不知道在这种情况下这是否有效。这个问题有意义吗?要选择第一个PDF,只需使用:Python 3.x Selenium python webscraper-如何仅选择网页列表中更改的第一个文档?,python-3.x,selenium,web-scraping,Python 3.x,Selenium,Web Scraping,所以,我写了大部分的webscraper,但有一件事我不知道怎么做,那就是从这个网站的文档列表中选择最上面/第一个pdf文档。新的PDF应该每月添加到相应年度文件夹的顶部。通常,我会通过xpath选择文档并以这种方式下载,但我不知道在这种情况下这是否有效。这个问题有意义吗?要选择第一个PDF,只需使用: driver.FindElementsByClassName("document-link")[0].click() 如果您现在想下载,请尝试: driver.FindEl
driver.FindElementsByClassName("document-link")[0].click()
如果您现在想下载,请尝试:
driver.FindElementById("ClicktoDownLoadnotice").click()
ClicktoDownLoadnotice是PDF预览按钮的id
最后,下载PDF:
driver.FindElementById("maskedImage").click()
如果您使用的是Chrome,则“maskedImage”是下载按钮的ID