Rapidminer能否从特定的URL列表中提取XPath值?

Rapidminer能否从特定的URL列表中提取XPath值?,xpath,web-scraping,web-crawler,rapidminer,Xpath,Web Scraping,Web Crawler,Rapidminer,我一直在和Rapidminer玩,似乎还没弄明白。我在excel文件中列出了一个巨大的URL列表,我想从每个URL中提取一个XPath元素。我能用Rapidminer做这件事吗 我已经看过Neil Mcguigan的教程,但它们似乎是从一般意义上对网站进行爬网,而不是从一组特定的URL进行爬网。您可能想看看,以及类似的网站爬网工具 对于这项工作,您可能只是使用了错误的工具:您希望从网站中获取数据,而不是进行实际的“数据挖掘”(这更像是一种启发式统计分析) (Java)和(Python)是开发自定

我一直在和Rapidminer玩,似乎还没弄明白。我在excel文件中列出了一个巨大的URL列表,我想从每个URL中提取一个XPath元素。我能用Rapidminer做这件事吗

我已经看过Neil Mcguigan的教程,但它们似乎是从一般意义上对网站进行爬网,而不是从一组特定的URL进行爬网。

您可能想看看,以及类似的网站爬网工具

对于这项工作,您可能只是使用了错误的工具:您希望从网站中获取数据,而不是进行实际的“数据挖掘”(这更像是一种启发式统计分析)


(Java)和(Python)是开发自定义网络爬虫和进行网络抓取的平台。

看起来与这个问题非常相似。