C# 使用Xml文档读取网页文本内容
我正在尝试使用Xml文档阅读网页文本:C# 使用Xml文档读取网页文本内容,c#,xml,webpage,C#,Xml,Webpage,我正在尝试使用Xml文档阅读网页文本: XmlDocument document = new XmlDocument(); string site = "https://emailhunter.co/search/a-bs.com"; document.Load(site); string allText = document.InnerText; 这是我得到的例外: System.Xml.dll中发生类型为“System.Xml.XmlException”的未处理异常 附加信息:“;”名称中
XmlDocument document = new XmlDocument();
string site = "https://emailhunter.co/search/a-bs.com";
document.Load(site);
string allText = document.InnerText;
这是我得到的例外:
System.Xml.dll中发生类型为“System.Xml.XmlException”的未处理异常
附加信息:“;”名称中不能包含十六进制值0x3B的字符。第5行,位置383
我真的不明白这里怎么了。如果你能给我一些建议,我会非常感激。你可以使用这篇文章中写的Html敏捷包:你可以使用这篇文章中写的Html敏捷包:url链接不指向xml文档这是Html文档。我认为您试图从由登录名保护的url读取内容。但HTML文档是XML文档,不是吗?不,HTML不是XML。请参见此处:该页面不受登录的保护url链接不指向xml文档这是html文档。我认为您试图从由登录名保护的url读取内容。但HTML文档是XML文档,不是吗?不,HTML不是XML。请参见此处:该页面不受登录的保护