Web scraping 是否有一种将div内容输出到文本文件并检查重复的刮削解决方案?

Web scraping 是否有一种将div内容输出到文本文件并检查重复的刮削解决方案?,web-scraping,automation,Web Scraping,Automation,我正试图建立一个质量保证自动化系统,在我的网站上的一个随机内容组件中检查一段时间内的重复。理想情况下,我希望运行一个后台脚本,该脚本执行以下操作: 定期扫描选定的div以查看内容的更改 检测到内容更改时,将内容输出到文本文件 显然,如果内容自上次刮取后没有更改,则必须放弃输出以避免误报 刮取内容时,检查以前刮取的内容是否相同 当检测到双重备份时,生成电子邮件通知 我想知道有什么可以至少部分实现这一目标,并从某个地方开始 感谢您的指点。哪个URL?哪个文本?我想自己测试一下。发布你的代码尝试。你自

我正试图建立一个质量保证自动化系统,在我的网站上的一个随机内容组件中检查一段时间内的重复。理想情况下,我希望运行一个后台脚本,该脚本执行以下操作:

  • 定期扫描选定的div以查看内容的更改
  • 检测到内容更改时,将内容输出到文本文件 显然,如果内容自上次刮取后没有更改,则必须放弃输出以避免误报
  • 刮取内容时,检查以前刮取的内容是否相同
  • 当检测到双重备份时,生成电子邮件通知
  • 我想知道有什么可以至少部分实现这一目标,并从某个地方开始


    感谢您的指点。

    哪个URL?哪个文本?我想自己测试一下。发布你的代码尝试。你自己尝试过什么,你到底在哪里?