Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
是否有特定的方法将XPath写入rapidminer以进行web爬网_Xpath_Web Scraping_Web Crawler_Rapidminer - Fatal编程技术网

是否有特定的方法将XPath写入rapidminer以进行web爬网

是否有特定的方法将XPath写入rapidminer以进行web爬网,xpath,web-scraping,web-crawler,rapidminer,Xpath,Web Scraping,Web Crawler,Rapidminer,我已经尝试了这么多的选择,在过去的许多天里尝试提取数据。我不知道我错在哪里。 例如,我在ReviewCenter.com网站上查看汽车销售网站评论。 我正在努力检索信息,我的大多数XPath看起来都不正确。 我在哪里可以最好地学习如何正确地做到这一点,我已经在这方面花了好几天时间 我知道如何复制XPath,但对于rapidminer,我无法提取数据。 我知道我做错了,但不幸的是我不知道什么是对的 例子包括 //*[@id="ReviewTitle-14068020"] h:html/h:hea

我已经尝试了这么多的选择,在过去的许多天里尝试提取数据。我不知道我错在哪里。 例如,我在ReviewCenter.com网站上查看汽车销售网站评论。 我正在努力检索信息,我的大多数XPath看起来都不正确。 我在哪里可以最好地学习如何正确地做到这一点,我已经在这方面花了好几天时间

我知道如何复制XPath,但对于rapidminer,我无法提取数据。 我知道我做错了,但不幸的是我不知道什么是对的

例子包括

//*[@id="ReviewTitle-14068020"]
h:html/h:head/h:title/text() 
this one works!
//*[@id="ReviewBox-14068020"]/div[1]/div[2]/p[2]/span

从网站检索xpath似乎没有问题,但使用它在rapidminer上提取数据根本不起作用。如果有人能给我指出正确的方向,我将不胜感激。

显然,您不想在xpath中使用唯一ID

确保您也理解了xml名称空间的概念