Hadoop 将多个Lucene分片索引加载到Solr
各位 我有多个(100个)分片Lucene索引(最初在Hadoop上生成),它们的格式是。总索引数据的大小为500GB,因此是碎片的数量Hadoop 将多个Lucene分片索引加载到Solr,hadoop,solr,lucene,Hadoop,Solr,Lucene,各位 我有多个(100个)分片Lucene索引(最初在Hadoop上生成),它们的格式是。总索引数据的大小为500GB,因此是碎片的数量 drwxr-x--- 2 index-66 drwxr-x--- 2 index-68 drwxr-x--- 2 index-9 .... .... 每个索引目录的格式是 $ls index-9 _4.fdt _4.fdx _4.fnm _4_Lucene40_0.frq _4_Lucene40_0.prx _4_Lucene40_0.tim _
drwxr-x--- 2 index-66
drwxr-x--- 2 index-68
drwxr-x--- 2 index-9
....
....
每个索引目录的格式是
$ls index-9
_4.fdt _4.fdx _4.fnm _4_Lucene40_0.frq _4_Lucene40_0.prx _4_Lucene40_0.tim _4_Lucene40_0.tip _4_nrm.cfe _4_nrm.cfs _4.si segments_1 segments.gen write.lock
现在,为了加载这个索引,我正在使用Lucene IndexMergeTool将所有碎片合并到一个巨大的索引中。我的问题是,有没有一种方法可以加载共享索引而不用在单个集合中合并成一个巨大的索引
所有索引都有相同的模式。以后如何访问索引?使用Solr还是Lucene API?我将通过Solr访问索引。