Php 有没有办法在一个站点上显示大量的外部rss源,而不需要物理上重新抓取它们?

Php 有没有办法在一个站点上显示大量的外部rss源,而不需要物理上重新抓取它们?,php,rss,Php,Rss,IMDb对他们列出的每一部电影都有一个单独的RSS提要。我有一个网站,有很多与电影相关的页面,我在每个页面上都存储了一个IMDB id 我想为每部电影展示每个RSS源的前5名结果。提要如下所示: 正如你所能想象的,IMDB有超过一百万部电影被编入索引,其中有大量电影实际上处于活动状态。很多人一天更新几次。有没有一种方法可以让我的服务器一天几次从IMDB中获取新闻的实时提要,而不必为每部电影实际获取每个RSS提要 我认为简单的答案是否定的。 除非imdb本身提供这样一个feed,否则必须在某处单

IMDb对他们列出的每一部电影都有一个单独的RSS提要。我有一个网站,有很多与电影相关的页面,我在每个页面上都存储了一个IMDB id

我想为每部电影展示每个RSS源的前5名结果。提要如下所示:


正如你所能想象的,IMDB有超过一百万部电影被编入索引,其中有大量电影实际上处于活动状态。很多人一天更新几次。有没有一种方法可以让我的服务器一天几次从IMDB中获取新闻的实时提要,而不必为每部电影实际获取每个RSS提要

我认为简单的答案是否定的。 除非imdb本身提供这样一个feed,否则必须在某处单独获取每个feed,以便找到包含最新新闻的电影

有一个问题,但我真的不认为这是你想要的


我假设理论上你可以使用一个组合提要,那么你的服务器只需要获取一个提要。但是,您仍然需要检查每一个电影提要,或者找到一些方法循环浏览它们(您的rss uri示例中的“tt1013743”部分是否为每一部新电影递增?)。实际上,我不知道管道是否能够处理这项潜在的巨大任务。您最好联系imdb并要求添加“最近更新的”rss源。

您可以在数据库中存储每个版本的内容长度标题信息。两个版本不太可能有完全相同的字节长度,可能发生的最糟糕的事情就是丢失一个更新,但这不是什么大问题。这样,您只需要发送头http请求,这非常便宜。在服务器端,您可以存储生成的缓存压缩文件(gzcompress),以确保尽可能小的文件大小。这样还可以节省解析RSS提要的XML时间


此外,您可以尝试从提要中仅获取5条最新新闻。另外,请确保使用cURL获取RSS,因为它非常灵活,可以接受压缩输入,因此您可以减少带宽使用和传输时间

谢谢-不知道imdb提供的几乎所有内容都是提要,很好。在IMO的使用条件(机器人和屏幕抓取)中有一段很好的话值得一提。除此之外,整件事对我来说似乎很奇怪。。我认为imdb.com/news获得的所有内容也将分配给相关电影。。但是有一些关于“骑士与白天”的新闻没有出现在前imdb.com/news/movie的骑士与白天RSS中,但其中一条返回了500个错误。。所以也没有发现什么