C# Html敏捷包:查找注释节点
我正在抓取一个使用Javascript动态填充Html敏捷包网站内容的网站 基本上,我是在搜索XPATHC# Html敏捷包:查找注释节点,c#,html,xpath,html-agility-pack,web-scraping,C#,Html,Xpath,Html Agility Pack,Web Scraping,我正在抓取一个使用Javascript动态填充Html敏捷包网站内容的网站 基本上,我是在搜索XPATH“\\div[@class='PricingInfo']”,但该div节点是通过Javascript写入DOM的 因此,当我通过Html敏捷包加载页面时,无法找到上面提到的XPATH 结果是在我要解析的特定脚本块之前有一条注释 <!--Module 328 Buying Options Table--> <script type="text/javascript" langu
“\\div[@class='PricingInfo']”
,但该div节点是通过Javascript写入DOM的
因此,当我通过Html敏捷包加载页面时,无法找到上面提到的XPATH
结果是在我要解析的特定脚本块之前有一条注释
<!--Module 328 Buying Options Table-->
<script type="text/javascript" language="JavaScript">
var data = {
price: 30.00
}
</script>
风险值数据={
价格:30.00
}
对于这个站点,有很多脚本块,因此我需要通过查找这个自动生成的注释
来缩小它的范围,并且该节点的兄弟节点将是正确的脚本块
你知道我如何搜索一个特定的注释,然后只获取相邻的脚本块吗
谢谢大家! +1表示不使用正则表达式!工作得很有魅力。非常感谢。现在,我需要一种解析Javascript对象的方法。只需再添加一件事。一旦我得到了脚本注释,我就能够通过使用正则表达式解析出我需要的信息。谢谢
htmlDoc.DocumentNode.SelectSingleNode("//comment()[contains(., 'Buying Options')]/following-sibling::script")