C# 提取div标记内的内容,忽略其中的其他标记
下面是示例html源代码C# 提取div标记内的内容,忽略其中的其他标记,c#,C#,下面是示例html源代码 我不想提取此文本 这是我想提取的文本 不管div标记的属性如何,我只想提取div标记文本,忽略div标记中的其他标记文本 在上面的示例中,我不想提取标记内的文本,但我想提取标记内的文本,即“这是我要提取的文本” XmlNodeList DivNodeList=xDoc.GetElementsByTagName(“div”); 字符串和文本; for(int i=0;i
我不想提取此文本
这是我想提取的文本
不管div标记的属性如何,我只想提取div标记文本,忽略div标记中的其他标记文本
在上面的示例中,我不想提取
标记内的文本,但我想提取
标记内的文本,即“这是我要提取的文本”
XmlNodeList DivNodeList=xDoc.GetElementsByTagName(“div”);
字符串和文本;
for(int i=0;i
但是上面的代码并没有像预期的那样工作,因为我正在检查p标记是否存在,然后只提取文本。显然,如果存在p标记,它将不会进入div标记的内部文本,而div标记的内部文本包含所有组合的文本,无论其中的标记是什么
非常感谢您在这方面提供的任何帮助。对于HTML处理,您应该尝试使用HTMLAlityPack库。 你的要求应该很容易做到。
看一看:对于HTML处理,您应该尝试使用HtmlAgilityPack库。 你的要求应该很容易做到。
看一看:使用JQuery,您可以通过这样做来实现:
$("#page2").clone().children().remove().end().text();
这应该归功于“DotNetWala”-
使用JQuery,您可以通过以下方式实现:
$("#page2").clone().children().remove().end().text();
这应该归功于“DotNetWala”-
$("#page2").clone().children().remove().end().text();