Web 在获取RSS数据时,如何确保RSS数据不重复

Web 在获取RSS数据时,如何确保RSS数据不重复,web,rss,rss-reader,Web,Rss,Rss Reader,正如我们所知,如果网站管理员更新RSS数据,RSS数据将更新,或者第三方库将更新RSS提要数据 现在,如果我正在编写RSS阅读器,那么每次我从网站的RSS源获取数据时 如何确保数据是否已提取 从: 只需要标题,链接,说明字段。不需要publidate。因此,我无法确保数据是否由我们通过pubDate或其他字段(如lastBuildDate字段)获取 那么,哪位朋友可以告诉我如何验证feed数据是否由我们获取 读取RSS源时,每个项目的guid元素用于检查该项目之前是否已被读取 guid可以是项

正如我们所知,如果网站管理员更新RSS数据,RSS数据将更新,或者第三方库将更新RSS提要数据

现在,如果我正在编写RSS阅读器,那么每次我从网站的RSS源获取数据时

如何确保数据是否已提取

从:

只需要
标题
链接
说明
字段。不需要
publidate
。因此,我无法确保数据是否由我们通过
pubDate
或其他字段(如
lastBuildDate
字段)获取


那么,哪位朋友可以告诉我如何验证feed数据是否由我们获取

读取RSS源时,每个项目的
guid
元素用于检查该项目之前是否已被读取

guid
可以是项目HTML版本的永久链接,如下所示:

<guid>http://dallas.example.com/1983/05/06/joebob.htm</guid>
尽管名称
guid
代表全局唯一ID,但RSS中不要求
guid
值全局唯一。你最多只能希望它对那个提要发布者来说是独一无二的


guid
元素是可选的。

最后,我发现链接可以确保项目是否被提取


我可以将提取的数据保存在我的数据库中,用户每次提取数据时,都可以通过
link
属性检查数据是否存在于数据库中。

其选项。我不能保证出版商会给它。
<guid isPermaLink="false">tag:dallas.example.com,4131:news</guid>