在使用C#解析博客页面的标题和链接方面有什么建议吗?

在使用C#解析博客页面的标题和链接方面有什么建议吗?,c#,header,hyperlink,html-parsing,C#,Header,Hyperlink,Html Parsing,我目前在业余时间自学C#,并想到了一个“小”项目来让我继续(我或其他人会发现这个项目很有用)。结果比我想象的要复杂。或者我只是在想是吗 无论如何,这个项目将解析我经常访问的博客(大多数是Wordpress博客)的主页,获取这些帖子的标题和链接,并通过任务栏中的气球提示通知我。除了让C#解析我需要的项目的HTML页面之外,我可以处理其余的事情。C#似乎没有任何内在的方法来做到这一点。谁能给我指一下正确的方向吗?我刚刚查看了HTML敏捷性包,但我仍在努力找到答案。一些示例代码也会很有帮助。提前谢谢

我目前在业余时间自学C#,并想到了一个“小”项目来让我继续(我或其他人会发现这个项目很有用)。结果比我想象的要复杂。或者我只是在想是吗


无论如何,这个项目将解析我经常访问的博客(大多数是Wordpress博客)的主页,获取这些帖子的标题和链接,并通过任务栏中的气球提示通知我。除了让C#解析我需要的项目的HTML页面之外,我可以处理其余的事情。C#似乎没有任何内在的方法来做到这一点。谁能给我指一下正确的方向吗?我刚刚查看了HTML敏捷性包,但我仍在努力找到答案。一些示例代码也会很有帮助。提前谢谢

如果您使用的是

此处选择页面上的所有链接(从):


如果您想学习如何查询
HtmlDocument

感谢您的快速响应,您可能需要重新学习一下。我曾试图从Codeplex中获取相同的样本,但我遇到了一些问题——我仍然对此束手无策。很抱歉我遇到了一个问题:新的HtmlDocument();它说“错误:类型'System.Windows.Forms.HtmlDocument'没有定义构造函数”,我应该怎么做才能消除这个问题?再次感谢。另外,如果有必要的话,我会使用Visual C#2010 Express。@DeVilFisCh-您需要在项目中添加对agility pack的引用,并在使用agility pack的类中为其添加一个
using
语句。@Oded-我将HTML agility pack库添加到项目中,但没有将其作为引用添加。我的错误。现在修复了该部分,并为库插入了using语句。不幸的是,我现在遇到了一个新错误:“'HtmlDocument'是'System.Windows.Forms.HtmlDocument'和'HTMLAgilityPack.HtmlDocument'之间的模糊引用;@Oded-我改为使用HTMLAgilityPack.HtmlDocument修复了它。我遇到了一个调试错误,因为它似乎在我测试它的站点中搜索表(如果我正确理解代码的话)1.我想试试别的,玩一会儿。
HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
   HtmlAttribute att = link["href"];
   att.Value = FixLink(att);
}
doc.Save("file.htm");