xpath使用chrome scraper从javascript谷歌地图标记中刮取数据
我试图学习如何抓取嵌入JavaScriptGoogleMaps标记中的数据 下面是一个我想从中获取的代码类型的示例,而不是实际的预期代码。注意:让我重复一遍,这只是一个示例,而不是实际的预期页面 我将代码放在粘贴箱中,因为代码片段太大了: 从这段代码中,我想提取如下数据: “质心id”:“23913” “纬度”:“35.899757906753” “经度”:“-79.046030044556” “地点名称”:“UNC McColl大楼” 联系信息 詹姆斯·布里顿 北卡罗来纳大学麦考尔大厦 可用性:通常周一、周二和周三下午可用。 如果你想要求时间,请给我发电子邮件。我不是 周末有空 停车:下午4点后不收停车费。如果白天有 游客停车场有一个停车收费表,每小时收费约1.50美元 小时 费用:25美元 费用详情:2小时考试25美元,3小时考试35美元。费用以地点为准 和监查 计算机考试:是的 在线/互联网考试:是 安静的计算机考试环境:封闭且持续 计算机考试的监督:是 纸本考试:是的 纸质考试的安静环境:是 对纸质考试进行密切和持续的监督:是 艾达:是的 XPath表达式是如何做到这一点的?我用的是铬合金刮刀。我还有别的办法吗 另外,有人能解释一下/t、/n、\t和\n的字符串是用来做什么的吗?例如:xpath使用chrome scraper从javascript谷歌地图标记中刮取数据,javascript,xpath,web-scraping,google-maps-markers,screen-scraping,Javascript,Xpath,Web Scraping,Google Maps Markers,Screen Scraping,我试图学习如何抓取嵌入JavaScriptGoogleMaps标记中的数据 下面是一个我想从中获取的代码类型的示例,而不是实际的预期代码。注意:让我重复一遍,这只是一个示例,而不是实际的预期页面 我将代码放在粘贴箱中,因为代码片段太大了: 从这段代码中,我想提取如下数据: “质心id”:“23913” “纬度”:“35.899757906753” “经度”:“-79.046030044556” “地点名称”:“UNC McColl大楼” 联系信息 詹姆斯·布里顿 北卡罗来纳大学麦考尔大厦 可用
\n\t\t\t\n\t\t\t\n\t\t\t\n\n\t\t<\/td>\n\n\t<\/tr>\n\n\t\t\n\n\t\n\t<tr>\n\n\t\t\t
\n\t\t\t\n\t\t\t\n\t\t\n\n\t\t\n\t\n\t\n\t\t\n\n\t\n\t\n\t\n\n\t\t\t
我认为您需要的不是XPath,而是一种解析代码并获取所需部分的方法。
一种方法是使用正则表达式,这在html上不起作用,另一种方法是使用html解析器
无论如何,你需要一些编程技巧来使用这些。例如,通过一些节点/javascript技能,您可以使用解析器完成工作
引用节点HTMLPasser的文档,该html:
<a href="test.html">xxx</a>
因此,基本上您可以读取任何文本内容并将其放入JavaScript变量中
关于你问题的最后一部分:
\n是换行符
\t转换成一个选项卡您能详细描述一下解析器的特性吗?
[ { type: 'tag'
, name: 'a'
, attribs: { href: 'test.html' }
, children: [ { data: 'xxx', type: 'text' } ]
}
]