Python 在href=#之后通过向网页输入日期来删除文件_Python_Selenium_Web Scraping_Xhtml_Beautifulsoup

Python 在href=#之后通过向网页输入日期来删除文件

python selenium web-scraping

Python 在href=#之后通过向网页输入日期来删除文件,python,selenium,web-scraping,xhtml,beautifulsoup,Python,Selenium,Web Scraping,Xhtml,Beautifulsoup,我正在尝试刮取以下页面：基本上，我需要的是输入我需要的网页日期（表上方），然后将这些天的数据下载到页面底部可用的excel文件中问题是我不知道如何以最简单的方式调整日期。Mechanize是一个选项，但我使用Python3，因此它不可用。此外，excel文件的链接为href=#，并自动下载。我如何访问和存储它以下是我的刮片代码： import requests import numpy as np from lxml import html payload = {'//*[@id="P

我正在尝试刮取以下页面：

基本上，我需要的是输入我需要的网页日期（表上方），然后将这些天的数据下载到页面底部可用的excel文件中

问题是我不知道如何以最简单的方式调整日期。Mechanize是一个选项，但我使用Python3，因此它不可用。此外，excel文件的链接为href=#，并自动下载。我如何访问和存储它

以下是我的刮片代码：

import requests
import numpy as np
from lxml import html


payload = {'//*[@id="PmumBI:baslangicTarih_input"]': '23.06.2015', '//*[@id="PmumBI:bitisTarih_input"]': ['23.06.2015'],'//*[@id="PmumBI:j_idt35"]':['submit']} 
page = requests.post("https://rapor.pmum.gov.tr/rapor/xhtml/ptfSmfListeleme.xhtml", data=payload) 
#page = get('https://rapor.pmum.gov.tr/rapor/xhtml/iskkRapor.xhtml',proxies=dict(c.pyxos‌.proxies)) 
tree = html.fromstring(page.text) 
data=tree.xpath('//td[@role="gridcell"]/text()') 
data=np.array(data)

你有一些你试过的代码吗？

payload={'/*[@id=“PmumBI:baslangicTarih_input”]：'23.06.2015'，'/*[@id=“PmumBI:bitisTarih_input”]：['23.06.2015']，'/*[@id=“PmumBI:j_idt35”]：['submit']}page=requests.post（“https://rapor.pmum.gov.tr/rapor/xhtml/ptfSmfListeleme.xhtml“，data=payload）#page=get('https://rapor.pmum.gov.tr/rapor/xhtml/iskkRapor.xhtml，proxies=dict（c.pyxos.proxies））tree=html.fromstring（page.text）data=tree.xpath（'//td[@role=“gridcell”]/text（）'）data=np.array（data）

不过，当日期发生变化时，这只是为了删除页面上的任何内容。但是，它们不会发生变化。很抱歉，这些评论的可读性很低。我在这里还是新手，请尝试解决所有问题。