Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/grails/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Solr使用中的澄清_Solr - Fatal编程技术网

Solr使用中的澄清

Solr使用中的澄清,solr,Solr,从中,我执行了以下步骤: 复制了我需要发布到exampledocs的文件(其中有post.jar) 使用java-Dauto-jar post.jar*.doc*.xls*.pdf命令将文档发布到solr 然后使用这个localhost:8983/solr/select?q=Gradient,我可以查询文档 我的问题是,我发布的文档是否已编入索引? 我之所以怀疑,是因为我从未为它定义过任何模式。 当我上传大量文档并进行查询时,它会很快吗?它们正在被索引。schema.xml文件中有一个预定义的模

从中,我执行了以下步骤:

  • 复制了我需要发布到exampledocs的文件(其中有post.jar)
  • 使用
    java-Dauto-jar post.jar*.doc*.xls*.pdf
    命令将文档发布到
    solr
  • 然后使用这个localhost:8983/solr/select?q=Gradient,我可以查询文档 我的问题是,我发布的文档是否已编入索引? 我之所以怀疑,是因为我从未为它定义过任何模式。
    当我上传大量文档并进行查询时,它会很快吗?

    它们正在被索引。schema.xml文件中有一个预定义的模式,它将使用该模式

    我发现使用Solr搜索时间非常快,有成千上万的文档

    编辑
    以下是我提到的设置指南:

    Solr设置:
    Nutch爬行网络(先做):
    Nucth爬行文件系统(请稍候):

    好的,我在一些门户网站上读到,使用post.jar发布数据的方式并不总是可取的。你能建议我做同样的事情的步骤吗?或者这本身就可以吗@Allan MacmillanI建立了一个ApacheNutch爬虫来爬网我的文件系统,Nutch内置了与Solr的集成,它可以将文件传输到Solr,以便Solr进行索引和存储。然后使用web服务创建搜索引擎。我写了一篇关于如何设置的博客,我将在上面发布