Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/261.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 简单XPath查询:没有结果_C#_.net_Html_Xml - Fatal编程技术网

C# 简单XPath查询:没有结果

C# 简单XPath查询:没有结果,c#,.net,html,xml,C#,.net,Html,Xml,我想在我的C#程序中解析网站的HTML 首先,我使用DLL将HTML转换为XML。为此,我使用以下方法: XmlDocument FromHtml(TextReader reader) { // setup SGMLReader Sgml.SgmlReader sgmlReader = new Sgml.SgmlReader(); sgmlReader.DocType = "HTML"; sgmlReader.WhitespaceHandling = Whites

我想在我的C#程序中解析网站的HTML

首先,我使用DLL将HTML转换为XML。为此,我使用以下方法:

XmlDocument FromHtml(TextReader reader)
{
    // setup SGMLReader
    Sgml.SgmlReader sgmlReader = new Sgml.SgmlReader();
    sgmlReader.DocType = "HTML";
    sgmlReader.WhitespaceHandling = WhitespaceHandling.None;
    sgmlReader.CaseFolding = Sgml.CaseFolding.ToLower;
    sgmlReader.InputStream = reader;

    // create document
    XmlDocument doc = new XmlDocument();
    doc.PreserveWhitespace = true;
    doc.XmlResolver = null;
    doc.Load(sgmlReader);
    return doc;
}
接下来,我阅读了一个网站,并尝试查找
标题
节点:

var client = new WebClient();
var xmlDoc = FromHtml(new StringReader(client.DownloadString(@"http://www.switchonthecode.com")));
var result = xmlDoc.DocumentElement.SelectNodes("head");
但是,此查询给出一个空结果(count==0)。但是,当我检查xmlDoc.DocumentElement的结果视图时,我看到以下内容:


知道为什么没有结果吗?请注意,当我尝试其他站点时,例如,它可以工作。

您可以使用它。它是一个开源的HTML解析器,您可以使用它。这是一个开源HTML解析器

您需要明确选择使用名称空间,请参见此


您需要显式地选择使用名称空间,请参见以下内容


头上有一个名称空间
——你可以在截图中看到它;
头上有一个名称空间
——你可以在截图中看到它技术上,代码给出了问题的正确答案。然而,我尝试了你的建议,它工作起来更容易,因为不需要名称空间!谢谢。从技术上讲,代码给出了问题的正确答案。然而,我尝试了你的建议,它工作起来更容易,因为不需要名称空间!谢谢
XmlNamespaceManager manager = new XmlNamespaceManager(doc.NameTable);
manager.AddNamespace("ns", "http://www.w3.org/1999/xhtml");

doc.DocumentElement.SelectNodes("ns:head", manager);