Hadoop 将多个Lucene分片索引加载到Solr

Hadoop 将多个Lucene分片索引加载到Solr,hadoop,solr,lucene,Hadoop,Solr,Lucene,各位 我有多个(100个)分片Lucene索引(最初在Hadoop上生成),它们的格式是。总索引数据的大小为500GB,因此是碎片的数量 drwxr-x--- 2 index-66 drwxr-x--- 2 index-68 drwxr-x--- 2 index-9 .... .... 每个索引目录的格式是 $ls index-9 _4.fdt _4.fdx _4.fnm _4_Lucene40_0.frq _4_Lucene40_0.prx _4_Lucene40_0.tim _

各位

我有多个(100个)分片Lucene索引(最初在Hadoop上生成),它们的格式是。总索引数据的大小为500GB,因此是碎片的数量

drwxr-x--- 2 index-66
drwxr-x--- 2 index-68
drwxr-x--- 2 index-9
....
....
每个索引目录的格式是

$ls index-9
_4.fdt  _4.fdx  _4.fnm  _4_Lucene40_0.frq  _4_Lucene40_0.prx  _4_Lucene40_0.tim  _4_Lucene40_0.tip  _4_nrm.cfe  _4_nrm.cfs  _4.si  segments_1  segments.gen  write.lock
现在,为了加载这个索引,我正在使用Lucene IndexMergeTool将所有碎片合并到一个巨大的索引中。我的问题是,有没有一种方法可以加载共享索引而不用在单个集合中合并成一个巨大的索引


所有索引都有相同的模式。

以后如何访问索引?使用Solr还是Lucene API?我将通过Solr访问索引。