Web scraping 不断保存在浏览器中打开的动态变化网页的内容_Web Scraping_Webpage

Web scraping 不断保存在浏览器中打开的动态变化网页的内容

web-scraping

Web scraping 不断保存在浏览器中打开的动态变化网页的内容,web-scraping,webpage,Web Scraping,Webpage,我想继续分析动态变化网页中的文本——内容是我的登录特定的，没有API通过脚本请求相同的内容因此，我分析内容的唯一方法是在浏览器中打开网页，然后以html（或其他合适的格式）保存网页并对其进行分析我需要每2-3秒做一次分析。因此，我可以考虑的一种方法是，通过脚本自动保存页面，并分析保存的内容。有人能给我一些用脚本保存打开的网页的方法吗或者其他一些方法来做我想做的分析。您可以使用无头Chrome节点API。这样你就可以：以编程方式导航到某个（或多个）页面等待它呈现（因为您的页面是动态的）

我想继续分析动态变化网页中的文本——内容是我的登录特定的，没有API通过脚本请求相同的内容

因此，我分析内容的唯一方法是在浏览器中打开网页，然后以html（或其他合适的格式）保存网页并对其进行分析

我需要每2-3秒做一次分析。因此，我可以考虑的一种方法是，通过脚本自动保存页面，并分析保存的内容。有人能给我一些用脚本保存打开的网页的方法吗

或者其他一些方法来做我想做的分析。

您可以使用无头Chrome节点API。这样你就可以：

以编程方式导航到某个（或多个）页面

等待它呈现（因为您的页面是动态的）

将其内容（HTML、PDF或其他格式）转储到文件中

按你想要的方式处理它

（可选）包括计时器循环（如

setInterval（（）=>{//Do stuff}，毫秒）

）

这样，您甚至不需要每隔2-3秒湿润所有页面。您只需每隔一段时间轮询页面的适当片段（例如，通过选择器）以获取所需信息，或者只需自动观看更改。谢谢。firefox有类似的API吗？是的，看一看。它支持Firefox