C# 如何在C中的H1标记之间获取HTML文本#
我需要解析一个HTML文档来提取所有H1标记以及它们之间的所有HTML。我一直在使用HtmlAgilityPack来实现这一目标,并取得了一些成功。我可以使用以下方法提取所有H1标签:C# 如何在C中的H1标记之间获取HTML文本#,c#,html,html-agility-pack,C#,Html,Html Agility Pack,我需要解析一个HTML文档来提取所有H1标记以及它们之间的所有HTML。我一直在使用HtmlAgilityPack来实现这一目标,并取得了一些成功。我可以使用以下方法提取所有H1标签: foreach(doc.DocumentNode.SelectNodes(“//h1”)中的HtmlNode节点) 但是如何在每个H1标记之后提取所有HTML,直到找到下一个H1标记?这个HTML可以包含来自表/图像/链接的任何内容,或者HTML页面上除H1标记以外的任何其他内容 提前感谢。可能的解决方案: 获取
foreach(doc.DocumentNode.SelectNodes(“//h1”)中的HtmlNode节点)
但是如何在每个H1标记之后提取所有HTML,直到找到下一个H1标记?这个HTML可以包含来自表/图像/链接的任何内容,或者HTML页面上除H1标记以外的任何其他内容
提前感谢。可能的解决方案:
获取完整的HTML作为字符串,用HTML不知道的符号替换