Web 在获取RSS数据时，如何确保RSS数据不重复_Web_Rss_Rss Reader

Web 在获取RSS数据时，如何确保RSS数据不重复

web rss

Web 在获取RSS数据时，如何确保RSS数据不重复,web,rss,rss-reader,Web,Rss,Rss Reader,正如我们所知，如果网站管理员更新RSS数据，RSS数据将更新，或者第三方库将更新RSS提要数据现在，如果我正在编写RSS阅读器，那么每次我从网站的RSS源获取数据时如何确保数据是否已提取从：只需要标题，链接，说明字段。不需要publidate。因此，我无法确保数据是否由我们通过pubDate或其他字段（如lastBuildDate字段）获取那么，哪位朋友可以告诉我如何验证feed数据是否由我们获取读取RSS源时，每个项目的guid元素用于检查该项目之前是否已被读取 guid可以是项

正如我们所知，如果网站管理员更新RSS数据，RSS数据将更新，或者第三方库将更新RSS提要数据

现在，如果我正在编写RSS阅读器，那么每次我从网站的RSS源获取数据时

如何确保数据是否已提取

从：

只需要

标题

，

链接

，

说明

字段。不需要

publidate

。因此，我无法确保数据是否由我们通过

pubDate

或其他字段（如

lastBuildDate

字段）获取

那么，哪位朋友可以告诉我如何验证feed数据是否由我们获取

读取RSS源时，每个项目的

guid

元素用于检查该项目之前是否已被读取

guid

可以是项目HTML版本的永久链接，如下所示：

<guid>http://dallas.example.com/1983/05/06/joebob.htm</guid>

尽管名称

guid

代表全局唯一ID，但RSS中不要求

guid

值全局唯一。你最多只能希望它对那个提要发布者来说是独一无二的

guid

元素是可选的。

最后，我发现链接可以确保项目是否被提取

我可以将提取的数据保存在我的数据库中，用户每次提取数据时，都可以通过

link

属性检查数据是否存在于数据库中。

其选项。我不能保证出版商会给它。

<guid isPermaLink="false">tag:dallas.example.com,4131:news</guid>