Python-下载页面';当它与多个其他页面共享一个URL时,将显示HTML
我目前正在用python编写一个程序,该程序将从我所在大学的班级注册网站上收集数据,以便在某个班级的座位开放时通知我 我使用selenium浏览各种下拉菜单和文本输入框。我可以成功地访问我想要访问的页面,但是从一个页面到另一个页面,URL的内容并不是唯一的 例如,您选择所需主题的页面是。如果我选择,比如说,用英语写URL就成了 无论我选择英语写作、数学、生物还是任何学科,这都是一样的。因此,如果我使用requests模块下载页面的HTML,就会收到404错误消息 是否有一些方法可以在不提供URL的情况下下载当前页面的HTMLPython-下载页面';当它与多个其他页面共享一个URL时,将显示HTML,python,python-2.7,python-3.x,selenium,python-requests,Python,Python 2.7,Python 3.x,Selenium,Python Requests,我目前正在用python编写一个程序,该程序将从我所在大学的班级注册网站上收集数据,以便在某个班级的座位开放时通知我 我使用selenium浏览各种下拉菜单和文本输入框。我可以成功地访问我想要访问的页面,但是从一个页面到另一个页面,URL的内容并不是唯一的 例如,您选择所需主题的页面是。如果我选择,比如说,用英语写URL就成了 无论我选择英语写作、数学、生物还是任何学科,这都是一样的。因此,如果我使用requests模块下载页面的HTML,就会收到404错误消息 是否有一些方法可以在不提供URL
提前感谢您的帮助 通常,您会以不同的方式格式化数据,但为了快速进行,下面介绍如何处理python请求
import requests
# all data here is the default except sel_subj=ACC
requests.post("https://wl11gp.neu.edu/udcprod8/NEUCLSS.p_class_search", data="sel_day=dummy&STU_TERM_IN=201754&sel_subj=dummy&sel_attr=dummy&sel_schd=dummy&sel_camp=dummy&sel_insm=dummy&sel_ptrm=dummy&sel_levl=dummy&sel_instr=dummy&sel_seat=dummy&p_msg_code=You+must+select+a+term.&sel_crn=&sel_subj=ACC&sel_crse=&sel_title=&sel_attr=%25&sel_levl=%25&sel_schd=%25&sel_insm=%25&sel_from_cred=&sel_to_cred=&sel_camp=%25&sel_ptrm=%25&sel_instr=%25&begin_hh=0&begin_mi=0&begin_ap=a&end_hh=0&end_mi=0&end_ap=a")
如果您检查p_class_select的html,您将看到一个带有action=“NEUCLSS.p_class_search”和method=“post”的表单。这就是您需要模拟的:一个使用所需数据进行p_class_搜索的POST请求,而不是下载/获取请求。有趣的是,我刚刚开始使用python,所以我必须阅读POST请求以及如何以这种方式操作HTML。谢谢你的快速回复@Prunechi您是否尝试过
驱动程序。当前url
?