在使用C#解析博客页面的标题和链接方面有什么建议吗？_C#_Header_Hyperlink_Html Parsing

在使用C#解析博客页面的标题和链接方面有什么建议吗？

c# hyperlink

在使用C#解析博客页面的标题和链接方面有什么建议吗？,c#,header,hyperlink,html-parsing,C#,Header,Hyperlink,Html Parsing,我目前在业余时间自学C#，并想到了一个“小”项目来让我继续（我或其他人会发现这个项目很有用）。结果比我想象的要复杂。或者我只是在想是吗无论如何，这个项目将解析我经常访问的博客（大多数是Wordpress博客）的主页，获取这些帖子的标题和链接，并通过任务栏中的气球提示通知我。除了让C#解析我需要的项目的HTML页面之外，我可以处理其余的事情。C#似乎没有任何内在的方法来做到这一点。谁能给我指一下正确的方向吗？我刚刚查看了HTML敏捷性包，但我仍在努力找到答案。一些示例代码也会很有帮助。提前谢谢

我目前在业余时间自学C#，并想到了一个“小”项目来让我继续（我或其他人会发现这个项目很有用）。结果比我想象的要复杂。或者我只是在想是吗

无论如何，这个项目将解析我经常访问的博客（大多数是Wordpress博客）的主页，获取这些帖子的标题和链接，并通过任务栏中的气球提示通知我。除了让C#解析我需要的项目的HTML页面之外，我可以处理其余的事情。C#似乎没有任何内在的方法来做到这一点。谁能给我指一下正确的方向吗？我刚刚查看了HTML敏捷性包，但我仍在努力找到答案。一些示例代码也会很有帮助。提前谢谢

如果您使用的是

此处选择页面上的所有链接（从）：

如果您想学习如何查询

HtmlDocument

感谢您的快速响应，您可能需要重新学习一下。我曾试图从Codeplex中获取相同的样本，但我遇到了一些问题——我仍然对此束手无策。很抱歉我遇到了一个问题：新的HtmlDocument（）；它说“错误：类型'System.Windows.Forms.HtmlDocument'没有定义构造函数”，我应该怎么做才能消除这个问题？再次感谢。另外，如果有必要的话，我会使用Visual C#2010 Express。@DeVilFisCh-您需要在项目中添加对agility pack的引用，并在使用agility pack的类中为其添加一个

using

语句。@Oded-我将HTML agility pack库添加到项目中，但没有将其作为引用添加。我的错误。现在修复了该部分，并为库插入了using语句。不幸的是，我现在遇到了一个新错误：“'HtmlDocument'是'System.Windows.Forms.HtmlDocument'和'HTMLAgilityPack.HtmlDocument'之间的模糊引用；@Oded-我改为使用HTMLAgilityPack.HtmlDocument修复了它。我遇到了一个调试错误，因为它似乎在我测试它的站点中搜索表（如果我正确理解代码的话）1.我想试试别的，玩一会儿。

HtmlDocument doc = new HtmlDocument();
doc.Load("file.htm");
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
{
   HtmlAttribute att = link["href"];
   att.Value = FixLink(att);
}
doc.Save("file.htm");