Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
xpath使用chrome scraper从javascript谷歌地图标记中刮取数据_Javascript_Xpath_Web Scraping_Google Maps Markers_Screen Scraping - Fatal编程技术网

xpath使用chrome scraper从javascript谷歌地图标记中刮取数据

xpath使用chrome scraper从javascript谷歌地图标记中刮取数据,javascript,xpath,web-scraping,google-maps-markers,screen-scraping,Javascript,Xpath,Web Scraping,Google Maps Markers,Screen Scraping,我试图学习如何抓取嵌入JavaScriptGoogleMaps标记中的数据 下面是一个我想从中获取的代码类型的示例,而不是实际的预期代码。注意:让我重复一遍,这只是一个示例,而不是实际的预期页面 我将代码放在粘贴箱中,因为代码片段太大了: 从这段代码中,我想提取如下数据: “质心id”:“23913” “纬度”:“35.899757906753” “经度”:“-79.046030044556” “地点名称”:“UNC McColl大楼” 联系信息 詹姆斯·布里顿 北卡罗来纳大学麦考尔大厦 可用

我试图学习如何抓取嵌入JavaScriptGoogleMaps标记中的数据

下面是一个我想从中获取的代码类型的示例,而不是实际的预期代码。注意:让我重复一遍,这只是一个示例,而不是实际的预期页面

我将代码放在粘贴箱中,因为代码片段太大了:

从这段代码中,我想提取如下数据:

“质心id”:“23913”

“纬度”:“35.899757906753”

“经度”:“-79.046030044556”

“地点名称”:“UNC McColl大楼”

联系信息

詹姆斯·布里顿

北卡罗来纳大学麦考尔大厦

可用性:通常周一、周二和周三下午可用。 如果你想要求时间,请给我发电子邮件。我不是 周末有空

停车:下午4点后不收停车费。如果白天有 游客停车场有一个停车收费表,每小时收费约1.50美元 小时

费用:25美元

费用详情:2小时考试25美元,3小时考试35美元。费用以地点为准 和监查

计算机考试:是的

在线/互联网考试:是

安静的计算机考试环境:封闭且持续 计算机考试的监督:是

纸本考试:是的

纸质考试的安静环境:是

对纸质考试进行密切和持续的监督:是

艾达:是的

XPath表达式是如何做到这一点的?我用的是铬合金刮刀。我还有别的办法吗

另外,有人能解释一下/t、/n、\t和\n的字符串是用来做什么的吗?例如:

\n\t\t\t\n\t\t\t\n\t\t\t\n\n\t\t<\/td>\n\n\t<\/tr>\n\n\t\t\n\n\t\n\t<tr>\n\n\t\t\t
\n\t\t\t\n\t\t\t\n\t\t\n\n\t\t\n\t\n\t\n\t\t\n\n\t\n\t\n\t\n\n\t\t\t

我认为您需要的不是XPath,而是一种解析代码并获取所需部分的方法。 一种方法是使用正则表达式,这在html上不起作用,另一种方法是使用html解析器

无论如何,你需要一些编程技巧来使用这些。例如,通过一些节点/javascript技能,您可以使用解析器完成工作

引用节点HTMLPasser的文档,该html:

<a href="test.html">xxx</a>
因此,基本上您可以读取任何文本内容并将其放入JavaScript变量中

关于你问题的最后一部分: \n是换行符
\t转换成一个选项卡

您能详细描述一下解析器的特性吗?
[ { type: 'tag'
  , name: 'a'
  , attribs: { href: 'test.html' }
  , children: [ { data: 'xxx', type: 'text' } ]
  }
]