如何在java应用程序中使用NutchAPI?

如何在java应用程序中使用NutchAPI?,java,web-crawler,nutch,Java,Web Crawler,Nutch,我想在java应用程序中使用Nutch API从网站抓取pdf链接进行分析,如何在java应用程序中使用Nutch jar?我可以举个例子吗?首先,您需要下载并提取Nutch,然后发出命令,以服务器的形式运行Nutch bin/nutch startserver 之后,您可以在Java中使用REST客户端,如RestTemplate,并调用所需的API。以下是Nutch提供的所有RESTAPI的文档 看看在这个示例GitHub存储库中是如何实现的:这里Nutch是从Java应用程序使用的,而不

我想在java应用程序中使用Nutch API从网站抓取pdf链接进行分析,如何在java应用程序中使用Nutch jar?我可以举个例子吗?

首先,您需要下载并提取Nutch,然后发出命令,以服务器的形式运行Nutch

bin/nutch startserver
之后,您可以在Java中使用REST客户端,如RestTemplate,并调用所需的API。以下是Nutch提供的所有RESTAPI的文档


看看在这个示例GitHub存储库中是如何实现的:这里Nutch是从Java应用程序使用的,而不是从命令行使用的。链接已断开。这一个似乎有效:。顺便说一句,NutchWebAPI绝对不是RESTful API。