如何在ubuntu 10.10中配置Nutch和solr?
我正试图为我最后一年的项目建立一个搜索引擎。在过去的两个月里,我做了很多关于这个话题的研究。 我发现我需要一个爬虫来爬网,一个解析器和一个索引器 我尝试使用Nutch作为爬虫程序,并使用solr对Nutch爬虫的数据进行索引。但我被困在这两个项目的安装部分。我正试图在互联网教程的帮助下在我的系统中安装Nutch和solr,但没有任何效果 我需要一些安装指南或链接,在那里我可以学习如何安装和集成Nutch和solr 接下来,我将继续使用解析器。我不知道这个阶段。我在这里需要关于如何在索引之前解析数据的帮助 我不想建立谷歌什么的。所有我需要的是从某些网站的某些项目进行搜索 我有Java的经验,我可以轻松地使用它,但我不是像你们这样的专业人士,请告诉我我是否朝着正确的方向前进,以及我下一步应该做什么 我使用的是Ubuntu10.10,还有ApacheTomcat7。用于nutch安装,用于与Solr集成 关于解析器,nutch有自己的解析器集,您不必费心解析。触发爬网命令,它将自动完成。除非您想解析nutch提供的内容之外的内容,否则这对您来说不是问题。如果您希望nutch解析一些.xyz文件,那么您需要为此编写解析器插件并与nutch集成如何在ubuntu 10.10中配置Nutch和solr?,solr,search-engine,web-crawler,nutch,ubuntu-10.10,Solr,Search Engine,Web Crawler,Nutch,Ubuntu 10.10,我正试图为我最后一年的项目建立一个搜索引擎。在过去的两个月里,我做了很多关于这个话题的研究。 我发现我需要一个爬虫来爬网,一个解析器和一个索引器 我尝试使用Nutch作为爬虫程序,并使用solr对Nutch爬虫的数据进行索引。但我被困在这两个项目的安装部分。我正试图在互联网教程的帮助下在我的系统中安装Nutch和solr,但没有任何效果 我需要一些安装指南或链接,在那里我可以学习如何安装和集成Nutch和solr 接下来,我将继续使用解析器。我不知道这个阶段。我在这里需要关于如何在索引之前解析数