C# 如何在C中确定网页是否有RSS#
我有任务要做 我需要下载一个网页,看看该网页是否包含任何RSS提要 我知道如何使用C#中的Http API将网页下载到字符串中,但如何确定Http页面字符串是否包含任何RSS提要 谢谢C# 如何在C中确定网页是否有RSS#,c#,http,rss,C#,Http,Rss,我有任务要做 我需要下载一个网页,看看该网页是否包含任何RSS提要 我知道如何使用C#中的Http API将网页下载到字符串中,但如何确定Http页面字符串是否包含任何RSS提要 谢谢 Jack我希望您必须将页面加载到dom(XmlDocument、XDocument或HtmlDocument)中,并检查以下节点: <link rel="alternate" type="application/atom+xml" ... 不要将HTML加载到XMLDocument中(如果它不符合XHTM
Jack我希望您必须将页面加载到dom(
XmlDocument
、XDocument
或HtmlDocument
)中,并检查以下节点:
<link rel="alternate" type="application/atom+xml" ...
不要将HTML加载到XMLDocument中(如果它不符合XHTML,则可能无法加载),而是尝试使用。它提供了类似于XMLDocument的语法,但可以使用格式错误的HTML
但通常,您会在页眉中查找该链接标记。使用正则表达式检查HTML中的链接标记
一种详尽的方法是对每个href链接进行爬虫,并检查rss或atom标记的内容类型和存在情况…该
无法保存,为时已晚。考虑到他正在搜索一个已知的标记,在这种情况下使用RegEx并不是不合理的,谢谢你的回复。我想要一些轻量级的东西,所以正则表达式听起来不错。Codebrain,你能给我一个正则表达式来找到链接吗?我真正需要的只是轻微的决心,这意味着我不需要对rss是否有效进行确凿的确认。我只需要知道这个页面是否有rss。