带dcs的集群远程lucene indec

带dcs的集群远程lucene indec,lucene,remote-server,carrot2,Lucene,Remote Server,Carrot2,我尝试使用远程服务器上的lucene索引作为同一服务器上安装的carrot2的输入。关于文档,这应该可以通过carrot2 dcs实现(文档第3.4章carrot2文档群集服务器:包括各种文档源。carrot2文档群集服务器可以从大量源获取和群集文档,包括主要搜索引擎和索引引擎(Lucene,Solr)) 在安装Carrot2DCS 3.9.3之后,我发现lucene不能作为文档源。如何继续?要从Lucene索引对内容进行群集,该索引需要在DCS运行的服务器上可用(通过本地文件系统或作为NSF挂

我尝试使用远程服务器上的lucene索引作为同一服务器上安装的carrot2的输入。关于文档,这应该可以通过carrot2 dcs实现(文档第3.4章carrot2文档群集服务器:包括各种文档源。carrot2文档群集服务器可以从大量源获取和群集文档,包括主要搜索引擎和索引引擎(Lucene,Solr))


在安装Carrot2DCS 3.9.3之后,我发现lucene不能作为文档源。如何继续?

要从Lucene索引对内容进行群集,该索引需要在DCS运行的服务器上可用(通过本地文件系统或作为NSF挂载)

要使Lucene源在DCS中可见,请执行以下操作:

  • 打开进行编辑:
    war/carrot2 dcs.war/WEB-INF/suites/source lucene attributes.xml
  • 取消对配置部分的注释,并提供Lucene索引的位置以及应该提供文档标题和内容的字段(至少需要一个)。请记住,字段必须为空
  • 确保已编辑的文件已打包回WAR存档并运行DCS。您现在应该可以看到Lucene文档源代码