Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/windows/14.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Windows 更新Solr 6.6.0中字段的配置_Windows_Solr - Fatal编程技术网

Windows 更新Solr 6.6.0中字段的配置

Windows 更新Solr 6.6.0中字段的配置,windows,solr,Windows,Solr,我使用ApacheSolr6.6.0通过递归索引文件夹中的所有文件来构建搜索引擎 我的做法如下:1我基于云示例创建了一个索引。2我为给定文件夹中的所有文件编制索引 bin\solr start -e cloud -noprompt java -Dc=gettingstarted -Dauto=yes -Ddata=files -Drecursive=yes -jar example\exampledocs\post.jar <path_to_folder> 稍后,当我在用户界面中搜

我使用ApacheSolr6.6.0通过递归索引文件夹中的所有文件来构建搜索引擎

我的做法如下:1我基于云示例创建了一个索引。2我为给定文件夹中的所有文件编制索引

bin\solr start -e cloud -noprompt
java -Dc=gettingstarted -Dauto=yes -Ddata=files -Drecursive=yes -jar example\exampledocs\post.jar <path_to_folder>
稍后,当我在用户界面中搜索查询时,我看到,即使它为我提供了最匹配项,它也没有为我提供文档内容。经过一些研究,我在托管架构文件中找到了一个名为_text_uu的字段及其配置:

<field name="_text_" type="text_general" multiValued="true" indexed="true" stored="false"/>
正如您所看到的,字段没有被存储,我认为这就是响应没有提供内容的原因

我走对了吗?如果是,如何编辑此字段的配置?我是否应该删除它并创建一个具有相同名称且stored=true的新文件

谢谢。

不应该存储“文本”字段,因为它被用作“全面覆盖”字段。因此,首先,您应该检查Solr配置,以确保它只包含文件内容。如果是这样,则可以将该字段标记为已存储

但是,一般来说,文件内容只是索引,而不是存储,因为

为了让最终用户看到内容,GUI有一些其他方式来访问文件内容,例如,通常静态资源(如txt文件)在单独的Apache实例中发布,因此从客户端的角度来看,只需创建一个HTTP URL 它大大增加了索引的大小 因此,换句话说:使用Solr进行搜索,一旦获得给定的项目元数据,使用其标识符进入其他系统并查看相应的内容。这是常见的*场景,尤其是处理txt文件等非结构化数据时

通常并不意味着它总是有效的。在某些情况下,您可能希望Solr这样做,或者一般来说,可能有其他一些很好的理由将字段标记为已存储,例如高亮显示
是的,我意识到,正如你所说,text_uuuu捕获所有内容,因此它必须包含所有内容,包括内容。但是,我觉得编辑此字段不是存储文档内容的最合适方式。没有更好的方法来存储内容吗?这取决于你对内容的处理;正如我所说,人们通常通过外部http服务提供文件内容。如果你认为这是你想要的,请接受答案。我知道这会增加索引大小,但我的目标是看看Solr如何解析文档并提取其内容。因此,自己提供内容对我的目标没有帮助。此外,突出显示匹配短语是我想添加的另一个特性;