使用python与本地HTML文件交互

使用python与本地HTML文件交互,python,html,web,web-scraping,python-requests,Python,Html,Web,Web Scraping,Python Requests,我想用python编写一个脚本,与包含大量javascript的网页进行交互(这是一个计算大量物理内容的网页) 如果页面格式发生更改,我不希望我的代码中断,我希望它脱机运行,因此我更希望我的脚本在我获得的页面的本地html副本上运行(所有JS代码都可以在html源代码中访问,不需要调用外部服务器)。我想使用请求库来完成这项工作,但它只适用于URL。有图书馆可以这样做吗?请注意,我想与HTML交互(输入值和查看输出等),我知道我可以解析文件,但这不是我要问的。我对网络机器人或任何相关的东西也完全陌

我想用python编写一个脚本,与包含大量javascript的网页进行交互(这是一个计算大量物理内容的网页)

如果页面格式发生更改,我不希望我的代码中断,我希望它脱机运行,因此我更希望我的脚本在我获得的页面的本地html副本上运行(所有JS代码都可以在html源代码中访问,不需要调用外部服务器)。我想使用请求库来完成这项工作,但它只适用于URL。有图书馆可以这样做吗?请注意,我想与HTML交互(输入值和查看输出等),我知道我可以解析文件,但这不是我要问的。我对网络机器人或任何相关的东西也完全陌生


现在,我可以用chrome离线打开我的.html版本的页面并与之交互,因此必须有一种方法以某种方式实现自动化。如果在另一种语言中有更好的python库,我也不反对使用python以外的其他语言。

有趣的问题,我能想到的最好方法是使用web框架,然后使用请求刮取数据。我很熟悉flask,它使用起来很简单,但我确信还有其他选择

试试selenium。它有助于解析支持JavaScript的HTML内容。请求不会从本地文件系统检索。您可以非常轻松地使用http.server在本地为页面提供服务,在这种情况下,请求可以检索页面,但是,如果文件是本地的,为什么还要麻烦使用请求呢?@barny,因为每次我按下一个按钮,页面上都会出现一些非常复杂的JS代码,这会产生一些结果,我想自动与之交互,但我还没有找到任何其他方法。如果不是请求,那么我应该使用什么?理解JS代码的工作原理比让机器人输入一个值并按下按钮检索结果要花更多的时间。因此,是的,您需要一个浏览器模拟,比如Selenium。请求可以发出HTTP GET请求,但需要一个浏览器来解释html+JS请求html+a本地httpserver?就我个人而言,我满怀激情地避免使用Selenium,但我知道用于QA的Cypress IO不适合自动化。