Javascript 如何检查html是否已更改?

Javascript 如何检查html是否已更改?,javascript,html,web-scraping,firefox-addon,web-crawler,Javascript,Html,Web Scraping,Firefox Addon,Web Crawler,如果那是错误的地方,我会道歉,但我不知道该问什么 我们正在构建Firefox插件,可以在选定的网站上运行。现在,由于这些网站往往会偶尔更改,我希望每天运行一次javascript脚本,检查代码的特定部分是否已更改,如果已更改,我们将收到一些返回消息(最好直接发送到我的电子邮件) 最简单、最简单的方法是什么?我读过关于网络爬虫和网络爬虫的文章,但他们做的似乎远远超出了我们的需要。我们基本上希望从连接到internet的PC上运行一个小脚本,该脚本将执行简单的检查,并在检测到html正文特定部分的更

如果那是错误的地方,我会道歉,但我不知道该问什么

我们正在构建Firefox插件,可以在选定的网站上运行。现在,由于这些网站往往会偶尔更改,我希望每天运行一次javascript脚本,检查代码的特定部分是否已更改,如果已更改,我们将收到一些返回消息(最好直接发送到我的电子邮件)

最简单、最简单的方法是什么?我读过关于网络爬虫和网络爬虫的文章,但他们做的似乎远远超出了我们的需要。我们基本上希望从连接到internet的PC上运行一个小脚本,该脚本将执行简单的检查,并在检测到html正文特定部分的更改(或者更具体地说,未找到选定的元素)后立即向我们发送电子邮件


非常感谢您的任何帮助

基本上,您可以设置Google电子表格,使用xpath刮取页面的各个部分。然后在电子表格中设置通知:工具->通知规则

现在,每当刮取函数(IMPORTXML)获取与前一个不同的内容时,电子表格都会触发一封邮件发送给您


作为一个现成的替代方案,我还建议跟踪页面和/或其部分(!)的更改,包括通过电子邮件通知。

您可以计算html(或其部分)的哈希,然后将其与以前的哈希进行比较,以查看是否有任何更改。但是,如果您想知道到底更改了什么,则需要保存html(或其中的一部分)并计算所需的时间。更具体地说,您希望读入特定url的html并指定一个变量,然后对某些html文本执行正则表达式搜索,然后根据该输出发送电子邮件。你可以使用bash或powershell实现这一点,很多网站都有广告,因此在提取html时,将广告部分替换为广告部分,因为广告部分变化很大。http头中不是有某种“无变化”标志吗?还是不可信的wrt广告?