在C#net中,如何解析HTML?

在C#net中,如何解析HTML?,c#,controls,browser,C#,Controls,Browser,我有一个网络浏览器控件。我把它导航到某个地址。当它加载时,我只想从这个代码中选择URL。有可能像xml一样处理html吗?如果可能的话,我也可以使用其他DOM属性。是否有任何类似xml的成分容器对象将html传递给它? 谢谢。听起来您需要使用 另请参见另一个堆栈溢出问题: 是的,您可以使用导航DOM。您需要在项目中添加对Microsoft.mshtml的引用。使用它获取文档中所有链接的示例如下: private void webBrowser1_DocumentCompleted(object

我有一个网络浏览器控件。我把它导航到某个地址。当它加载时,我只想从这个代码中选择URL。有可能像xml一样处理html吗?如果可能的话,我也可以使用其他DOM属性。是否有任何类似xml的成分容器对象将html传递给它?
谢谢。

听起来您需要使用

另请参见另一个堆栈溢出问题:

是的,您可以使用导航DOM。您需要在项目中添加对
Microsoft.mshtml
的引用。使用它获取文档中所有链接的示例如下:

private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
{
    HtmlDocument doc = webBrowser1.Document;

    foreach (HtmlElement element in doc.Links)
    {
        HTMLAnchorElement link = (HTMLAnchorElement) element.DomElement;
        Debug.WriteLine(link.href);
    }
}

我不太明白你想做什么。你能再解释一下吗?是的,我有一个小项目。表单上有一个webbrowser控件。当它加载一个url时,我想获取url(标记)地址并将它们放入一个集合,或者将它们写入一个文本区域。要做到这一点,我希望像使用xml一样使用它。然后我是否应该将html转换为xhtml或其他格式?现在我正在搜索HTML敏捷包。任何土生土长的方法都会出现。谢谢PS:对不起,我的英语很差。