Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/three.js/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 提取div标记内的内容,忽略其中的其他标记_C# - Fatal编程技术网

C# 提取div标记内的内容,忽略其中的其他标记

C# 提取div标记内的内容,忽略其中的其他标记,c#,C#,下面是示例html源代码 我不想提取此文本 这是我想提取的文本 不管div标记的属性如何,我只想提取div标记文本,忽略div标记中的其他标记文本 在上面的示例中,我不想提取标记内的文本,但我想提取标记内的文本,即“这是我要提取的文本” XmlNodeList DivNodeList=xDoc.GetElementsByTagName(“div”); 字符串和文本; for(int i=0;i

下面是示例html源代码

我不想提取此文本

这是我想提取的文本
不管div标记的属性如何,我只想提取div标记文本,忽略div标记中的其他标记文本

在上面的示例中,我不想提取

标记内的文本,但我想提取
标记内的文本,即“这是我要提取的文本”

XmlNodeList DivNodeList=xDoc.GetElementsByTagName(“div”);
字符串和文本;
for(int i=0;i
但是上面的代码并没有像预期的那样工作,因为我正在检查p标记是否存在,然后只提取文本。显然,如果存在p标记,它将不会进入div标记的内部文本,而div标记的内部文本包含所有组合的文本,无论其中的标记是什么


非常感谢您在这方面提供的任何帮助。

对于HTML处理,您应该尝试使用HTMLAlityPack库。 你的要求应该很容易做到。
看一看:

对于HTML处理,您应该尝试使用HtmlAgilityPack库。 你的要求应该很容易做到。
看一看:

使用JQuery,您可以通过这样做来实现:

$("#page2").clone().children().remove().end().text();

这应该归功于“DotNetWala”-

使用JQuery,您可以通过以下方式实现:

$("#page2").clone().children().remove().end().text();

这应该归功于“DotNetWala”-

$("#page2").clone().children().remove().end().text();