如何解析HTML或将HTML转换为XML,以便从网站中提取信息(用C#)

如何解析HTML或将HTML转换为XML,以便从网站中提取信息(用C#),c#,html,xml,C#,Html,Xml,可能重复: 有没有办法解析HTML或将HTML转换为XML,这样我就可以轻松地从网站中提取信息 我和C#一起工作 谢谢你,正是你想要的。查看本教程您可以使用Microsoft HTML对象库中的COM对象加载HTML,然后使用其对象模型进行导航。示例如下所示: string html; WebClient webClient = new WebClient(); using (Stream stream = webClient.OpenRead(new Uri("http://www.goog

可能重复:

有没有办法解析HTML或将HTML转换为XML,这样我就可以轻松地从网站中提取信息

我和C#一起工作


谢谢你,

正是你想要的。查看本教程

您可以使用Microsoft HTML对象库中的COM对象加载HTML,然后使用其对象模型进行导航。示例如下所示:

string html;
WebClient webClient = new WebClient();
using (Stream stream = webClient.OpenRead(new Uri("http://www.google.com")))
using (StreamReader reader = new StreamReader(stream))
{
  html = reader.ReadToEnd();
}
IHTMLDocument2 doc = (IHTMLDocument2)new HTMLDocument();
doc.write(html);
foreach (IHTMLElement el in doc.all)
  Console.WriteLine(el.tagName);
你应该去看看报纸。