Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/matlab/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
什么';检查RSS提要以获取新条目的可靠方法是什么?_Rss_Updates_Detect_Feed_Atom Feed - Fatal编程技术网

什么';检查RSS提要以获取新条目的可靠方法是什么?

什么';检查RSS提要以获取新条目的可靠方法是什么?,rss,updates,detect,feed,atom-feed,Rss,Updates,Detect,Feed,Atom Feed,我正在构建的应用程序的一部分需要检查RSS提要以获取更新。我正在寻找一种可靠的方法来知道feed是否有新条目 我知道有时候人们会把帖子发到未来,然后再发到现在,这可能会导致一些条目被隐藏。似乎还有比这更复杂的事情。我还知道,对标题或内容进行哈希运算会导致性能不佳和结果不可靠,因为这些内容可能会更改,并且不是新条目的迹象。我知道几年前,当我手动维护一个播客RSS提要时,我从未更改过这个项目 所以,我需要一些方法来可靠地检查RSS、Atom等提要中的新条目,因为它们是经过持续检查的 具体来说,该应用

我正在构建的应用程序的一部分需要检查RSS提要以获取更新。我正在寻找一种可靠的方法来知道feed是否有新条目

我知道有时候人们会把帖子发到未来,然后再发到现在,这可能会导致一些条目被隐藏。似乎还有比这更复杂的事情。我还知道,对标题或内容进行哈希运算会导致性能不佳和结果不可靠,因为这些内容可能会更改,并且不是新条目的迹象。我知道几年前,当我手动维护一个播客RSS提要时,我从未更改过这个项目

所以,我需要一些方法来可靠地检查RSS、Atom等提要中的新条目,因为它们是经过持续检查的


具体来说,该应用程序将使用Python为Google App Engine编写,但我怀疑这在本例中太重要了。

您可以通过在http请求中添加if-modified-since头来使用条件get。如果没有更改,性能良好的服务器将返回未修改的数据。

提要项具有唯一的id和/或可能是唯一的url。仅将它们散列在一起,以获得一种快速而合理的方法来检测更改。但唯一能绝对确定的方法是像你说的那样对内容进行散列。

这有多可靠?找到性能不好的服务器的可能性有多大?大多数主要服务器和主要博客平台都支持条件GET。这通常是重度博客的一个要求,因为它可以节省带宽。我猜,使用这个和Tim对不支持条件get的服务器的响应可以让你达到99%的效果。好吧,就像我说的,如果内容改变,提要将被标记为更新,但不会有新帖子。我想我需要修改我的问题。完全依赖唯一ID会有什么问题?