Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/316.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 如何在C中确定网页是否有RSS#_C#_Http_Rss - Fatal编程技术网

C# 如何在C中确定网页是否有RSS#

C# 如何在C中确定网页是否有RSS#,c#,http,rss,C#,Http,Rss,我有任务要做 我需要下载一个网页,看看该网页是否包含任何RSS提要 我知道如何使用C#中的Http API将网页下载到字符串中,但如何确定Http页面字符串是否包含任何RSS提要 谢谢 Jack我希望您必须将页面加载到dom(XmlDocument、XDocument或HtmlDocument)中,并检查以下节点: <link rel="alternate" type="application/atom+xml" ... 不要将HTML加载到XMLDocument中(如果它不符合XHTM

我有任务要做

我需要下载一个网页,看看该网页是否包含任何RSS提要

我知道如何使用C#中的Http API将网页下载到字符串中,但如何确定Http页面字符串是否包含任何RSS提要

谢谢


Jack

我希望您必须将页面加载到dom(
XmlDocument
XDocument
HtmlDocument
)中,并检查以下节点:

<link rel="alternate" type="application/atom+xml" ...

不要将HTML加载到XMLDocument中(如果它不符合XHTML,则可能无法加载),而是尝试使用。它提供了类似于XMLDocument的语法,但可以使用格式错误的HTML


但通常,您会在页眉中查找该链接标记。

使用正则表达式检查HTML中的链接标记


一种详尽的方法是对每个href链接进行爬虫,并检查rss或atom标记的内容类型和存在情况…

无法保存,为时已晚。考虑到他正在搜索一个已知的标记,在这种情况下使用RegEx并不是不合理的,谢谢你的回复。我想要一些轻量级的东西,所以正则表达式听起来不错。Codebrain,你能给我一个正则表达式来找到链接吗?我真正需要的只是轻微的决心,这意味着我不需要对rss是否有效进行确凿的确认。我只需要知道这个页面是否有rss。