Web scraping 不断保存在浏览器中打开的动态变化网页的内容

Web scraping 不断保存在浏览器中打开的动态变化网页的内容,web-scraping,webpage,Web Scraping,Webpage,我想继续分析动态变化网页中的文本——内容是我的登录特定的,没有API通过脚本请求相同的内容 因此,我分析内容的唯一方法是在浏览器中打开网页,然后以html(或其他合适的格式)保存网页并对其进行分析 我需要每2-3秒做一次分析。因此,我可以考虑的一种方法是,通过脚本自动保存页面,并分析保存的内容。有人能给我一些用脚本保存打开的网页的方法吗 或者其他一些方法来做我想做的分析。您可以使用无头Chrome节点API。这样你就可以: 以编程方式导航到某个(或多个)页面 等待它呈现(因为您的页面是动态的)

我想继续分析动态变化网页中的文本——内容是我的登录特定的,没有API通过脚本请求相同的内容

因此,我分析内容的唯一方法是在浏览器中打开网页,然后以html(或其他合适的格式)保存网页并对其进行分析

我需要每2-3秒做一次分析。因此,我可以考虑的一种方法是,通过脚本自动保存页面,并分析保存的内容。有人能给我一些用脚本保存打开的网页的方法吗

或者其他一些方法来做我想做的分析。

您可以使用无头Chrome节点API。这样你就可以:

  • 以编程方式导航到某个(或多个)页面
  • 等待它呈现(因为您的页面是动态的)
  • 将其内容(HTML、PDF或其他格式)转储到文件中
  • 按你想要的方式处理它
  • (可选)包括计时器循环(如
    setInterval(()=>{//Do stuff},毫秒)

  • 这样,您甚至不需要每隔2-3秒湿润所有页面。您只需每隔一段时间轮询页面的适当片段(例如,通过选择器)以获取所需信息,或者只需自动观看更改。谢谢。firefox有类似的API吗?是的,看一看。它支持Firefox