Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在ubuntu 10.10中配置Nutch和solr?_Solr_Search Engine_Web Crawler_Nutch_Ubuntu 10.10 - Fatal编程技术网

如何在ubuntu 10.10中配置Nutch和solr?

如何在ubuntu 10.10中配置Nutch和solr?,solr,search-engine,web-crawler,nutch,ubuntu-10.10,Solr,Search Engine,Web Crawler,Nutch,Ubuntu 10.10,我正试图为我最后一年的项目建立一个搜索引擎。在过去的两个月里,我做了很多关于这个话题的研究。 我发现我需要一个爬虫来爬网,一个解析器和一个索引器 我尝试使用Nutch作为爬虫程序,并使用solr对Nutch爬虫的数据进行索引。但我被困在这两个项目的安装部分。我正试图在互联网教程的帮助下在我的系统中安装Nutch和solr,但没有任何效果 我需要一些安装指南或链接,在那里我可以学习如何安装和集成Nutch和solr 接下来,我将继续使用解析器。我不知道这个阶段。我在这里需要关于如何在索引之前解析数

我正试图为我最后一年的项目建立一个搜索引擎。在过去的两个月里,我做了很多关于这个话题的研究。 我发现我需要一个爬虫来爬网,一个解析器和一个索引器

我尝试使用Nutch作为爬虫程序,并使用solr对Nutch爬虫的数据进行索引。但我被困在这两个项目的安装部分。我正试图在互联网教程的帮助下在我的系统中安装Nutch和solr,但没有任何效果

我需要一些安装指南或链接,在那里我可以学习如何安装和集成Nutch和solr

接下来,我将继续使用解析器。我不知道这个阶段。我在这里需要关于如何在索引之前解析数据的帮助

我不想建立谷歌什么的。所有我需要的是从某些网站的某些项目进行搜索

我有Java的经验,我可以轻松地使用它,但我不是像你们这样的专业人士,请告诉我我是否朝着正确的方向前进,以及我下一步应该做什么

我使用的是Ubuntu10.10,还有ApacheTomcat7。

用于nutch安装,用于与Solr集成

关于解析器,nutch有自己的解析器集,您不必费心解析。触发爬网命令,它将自动完成。除非您想解析nutch提供的内容之外的内容,否则这对您来说不是问题。如果您希望nutch解析一些.xyz文件,那么您需要为此编写解析器插件并与nutch集成