C# 如何阅读全文RSS提要

C# 如何阅读全文RSS提要,c#,asp.net,rss,feed,C#,Asp.net,Rss,Feed,当Rss地址没有全文时,某些站点可以获取全文Rss提要 喜欢这个网站吗 我该怎么做 我对C#知之甚少,但我仍然可以就如何解决你的问题给出一个大致的答案。RSS提要(几乎)总是链接到文章,在报纸/博客的网站上,可以看到整篇文章。因此“RSS填充器”从网站内容中提取文章内容,并基本上将其放回提要中,取代可用的(简短的)介绍 要实现这一点,您需要: 解析/生成RSS/Atoms提要(我确信有很多C#lib可以做到这一点) 从原始RSS提要中链接的html页面中查找实际文章。实际上,链接页面包含了很多

当Rss地址没有全文时,某些站点可以获取全文Rss提要 喜欢这个网站吗

我该怎么做

我对C#知之甚少,但我仍然可以就如何解决你的问题给出一个大致的答案。RSS提要(几乎)总是链接到文章,在报纸/博客的网站上,可以看到整篇文章。因此“RSS填充器”从网站内容中提取文章内容,并基本上将其放回提要中,取代可用的(简短的)介绍

要实现这一点,您需要:

  • 解析/生成RSS/Atoms提要(我确信有很多C#lib可以做到这一点)
  • 从原始RSS提要中链接的html页面中查找实际文章。实际上,链接页面包含了很多你不想放在“完整”RSS提要中的东西(比如网站标题、导航栏、广告、评论、类似facebook的按钮等等)。要做到这一点,最简单的方法是使用
    可读性
    (谷歌快速检查)
如果你把这两者结合起来,你就能实现你的目标


您可以在中找到此类工具的一个实现,它们的源代码(对于旧版本)位于/content only/。它是用PHP编写的,但它可以提供如何进行的大致思路。

您可以从网站获得完整的脚本,该脚本可以放大部分rss提要 这些步骤包括: -从RSS源获取帖子URL。
-获取帖子URL的完整内容,它将使用curl获取内容。
-解析内容时,它会使用模板。他们不断更新最流行网站和wordpress主题的模板。根据模板,将html内容解析为html dom对象,然后根据html dom对象查找内容。
-最后,再次生成包含完整内容的rss提要


您可以查看用PHP编写的脚本以了解一些想法,稍后您可以将逻辑重写为任何语言。

您是否在询问如果站点不提供RSS提要如何进行屏幕刮取?不,我是在询问当RSS只有摘要时如何在RSS中设置所有描述