Python 在href=#之后通过向网页输入日期来删除文件

Python 在href=#之后通过向网页输入日期来删除文件,python,selenium,web-scraping,xhtml,beautifulsoup,Python,Selenium,Web Scraping,Xhtml,Beautifulsoup,我正在尝试刮取以下页面: 基本上,我需要的是输入我需要的网页日期(表上方),然后将这些天的数据下载到页面底部可用的excel文件中 问题是我不知道如何以最简单的方式调整日期。Mechanize是一个选项,但我使用Python3,因此它不可用。此外,excel文件的链接为href=#,并自动下载。我如何访问和存储它 以下是我的刮片代码: import requests import numpy as np from lxml import html payload = {'//*[@id="P

我正在尝试刮取以下页面:

基本上,我需要的是输入我需要的网页日期(表上方),然后将这些天的数据下载到页面底部可用的excel文件中

问题是我不知道如何以最简单的方式调整日期。Mechanize是一个选项,但我使用Python3,因此它不可用。此外,excel文件的链接为href=#,并自动下载。我如何访问和存储它

以下是我的刮片代码:

import requests
import numpy as np
from lxml import html


payload = {'//*[@id="PmumBI:baslangicTarih_input"]': '23.06.2015', '//*[@id="PmumBI:bitisTarih_input"]': ['23.06.2015'],'//*[@id="PmumBI:j_idt35"]':['submit']} 
page = requests.post("https://rapor.pmum.gov.tr/rapor/xhtml/ptfSmfListeleme.xhtml", data=payload) 
#page = get('https://rapor.pmum.gov.tr/rapor/xhtml/iskkRapor.xhtml',proxies=dict(c.pyxos‌​.proxies)) 
tree = html.fromstring(page.text) 
data=tree.xpath('//td[@role="gridcell"]/text()') 
data=np.array(data)

你有一些你试过的代码吗?
payload={'/*[@id=“PmumBI:baslangicTarih_input”]:'23.06.2015','/*[@id=“PmumBI:bitisTarih_input”]:['23.06.2015'],'/*[@id=“PmumBI:j_idt35”]:['submit']}page=requests.post(“https://rapor.pmum.gov.tr/rapor/xhtml/ptfSmfListeleme.xhtml“,data=payload)#page=get('https://rapor.pmum.gov.tr/rapor/xhtml/iskkRapor.xhtml,proxies=dict(c.pyxos.proxies))tree=html.fromstring(page.text)data=tree.xpath('//td[@role=“gridcell”]/text()')data=np.array(data)
不过,当日期发生变化时,这只是为了删除页面上的任何内容。但是,它们不会发生变化。很抱歉,这些评论的可读性很低。我在这里还是新手,请尝试解决所有问题。