Solr Mahout和Lucene版本兼容性

Solr Mahout和Lucene版本兼容性,solr,lucene,mahout,Solr,Lucene,Mahout,我试图使用Mahout对存储在Solr/Lucene索引中的术语向量进行一些分析。不幸的是,最新的Mahout版本似乎落后于最新的Solr/Lucene版本 我的Solr/Lucene安装是4.10.3。据我所知,最新的Mahout 1.0版预计Lucene索引版本为4.6.1 当我运行mahout lucene.vector时,我得到一个错误: Exception in thread "main" org.apache.lucene.index.IndexFormatTooNewExcepti

我试图使用Mahout对存储在Solr/Lucene索引中的术语向量进行一些分析。不幸的是,最新的Mahout版本似乎落后于最新的Solr/Lucene版本

我的Solr/Lucene安装是4.10.3。据我所知,最新的Mahout 1.0版预计Lucene索引版本为4.6.1

当我运行mahout lucene.vector时,我得到一个错误:

Exception in thread "main" org.apache.lucene.index.IndexFormatTooNewException: Format version is not supported (resource: MMapIndexInput(path="/path/to/data/index/segments.gen")): -3 (needs to be between -2 and -2)
到目前为止,我尝试了两种方法来解决这个问题:

首先,我编辑了solrconfig.xml文件,说:

<luceneMatchVersion>4.6.1</luceneMatchVersion>
删除我的索引数据,并从原始文档构建一个干净的索引。这对修复错误没有任何作用

因此,第二,我尝试将Mahout pom.xml文件中的lucene.version更改为4.10.3,并重新编译二进制文件,以查看是否添加了这些功能。我知道这不太可能奏效,但还是试过了


我的问题是,如果Solr用于编写索引文件的Lucene版本不是solrconfig.xml中的上述luceneMatchVersion设置,我如何适当地更改它?

Mahout目前似乎支持Solr 3.x。您可以为mahout试用此修补程序。

该修补程序已有几年历史,并且已经是发布版本的一部分。Mahout目前支持Solr/Lucene 4.6.1开箱即用。