lucene索引具有多表的大型数据库

lucene索引具有多表的大型数据库,lucene,lucene.net,Lucene,Lucene.net,我有两个表,其中一个表有巨大的网站文本(不是html)数据(15gb)。我想索引这10个表(具有关系)。 例如:从表1 a、表2 b中选择a.id、a.title、a.ipaddress、b.content,其中a.id=b.id 这里的问题是,从oracle数据库检索数据进行索引需要70-80个小时。我尝试了服务器端分页,比如rownum>1和 是否可以使用两个索引的组合检索数据 是的,可以从两个索引检索数据 为每个索引打开一个IndexReaders。叫他们reader1和reader2。然

我有两个表,其中一个表有巨大的网站文本(不是html)数据(15gb)。我想索引这10个表(具有关系)。 例如:从表1 a、表2 b中选择a.id、a.title、a.ipaddress、b.content,其中a.id=b.id

这里的问题是,从oracle数据库检索数据进行索引需要70-80个小时。我尝试了服务器端分页,比如rownum>1和 是否可以使用两个索引的组合检索数据

是的,可以从两个索引检索数据

为每个索引打开一个IndexReaders。叫他们reader1和reader2。然后,您可以使用读取索引并附加内容

MultiReader MultiReader=新的MultiReader(reader1,reader2);
IndexSearcher搜索器=新的IndexSearcher(多阅读器)

参考:

哪一个最好?单独索引还是作为单个索引?注意:数据库中的数据不会更新。我只需要最好的方法

由于数据库中的数据不会更改,我建议您使用单个索引

另一方面,你可能想看看