是否有特定的方法将XPath写入rapidminer以进行web爬网_Xpath_Web Scraping_Web Crawler_Rapidminer

是否有特定的方法将XPath写入rapidminer以进行web爬网

xpath web-scraping web-crawler

是否有特定的方法将XPath写入rapidminer以进行web爬网,xpath,web-scraping,web-crawler,rapidminer,Xpath,Web Scraping,Web Crawler,Rapidminer,我已经尝试了这么多的选择，在过去的许多天里尝试提取数据。我不知道我错在哪里。例如，我在ReviewCenter.com网站上查看汽车销售网站评论。我正在努力检索信息，我的大多数XPath看起来都不正确。我在哪里可以最好地学习如何正确地做到这一点，我已经在这方面花了好几天时间我知道如何复制XPath，但对于rapidminer，我无法提取数据。我知道我做错了，但不幸的是我不知道什么是对的例子包括 //*[@id="ReviewTitle-14068020"] h:html/h:hea

我已经尝试了这么多的选择，在过去的许多天里尝试提取数据。我不知道我错在哪里。例如，我在ReviewCenter.com网站上查看汽车销售网站评论。我正在努力检索信息，我的大多数XPath看起来都不正确。我在哪里可以最好地学习如何正确地做到这一点，我已经在这方面花了好几天时间

我知道如何复制XPath，但对于rapidminer，我无法提取数据。我知道我做错了，但不幸的是我不知道什么是对的

例子包括

//*[@id="ReviewTitle-14068020"]
h:html/h:head/h:title/text() 
this one works!
//*[@id="ReviewBox-14068020"]/div[1]/div[2]/p[2]/span

从网站检索xpath似乎没有问题，但使用它在rapidminer上提取数据根本不起作用。如果有人能给我指出正确的方向，我将不胜感激。

显然，您不想在xpath中使用唯一ID

确保您也理解了xml名称空间的概念