在lucene中索引多个数据库(以及在低基数字段上的性能)

在lucene中索引多个数据库(以及在低基数字段上的性能),lucene,database-performance,Lucene,Database Performance,我必须在Lucene索引中索引几个关系数据库(用于基于值的搜索)。 有些搜索将搜索特定数据库中的值,其他搜索将搜索所有数据库中的值 我可以想出两种方法来实现这一点: 创建一个大索引并添加一个名为database_id的字段。在查询某些特定数据库时使用此字段 为每个数据库创建一个索引。当查询一个数据库时,我将只将查询指向一个索引,当查询所有数据库时,我将使用对所有索引运行查询的MultiReader 选项2对我来说似乎更舒服,因为当只查询一个数据库时,维护更容易,查询更快。我还看到一些帖子说低基数

我必须在Lucene索引中索引几个关系数据库(用于基于值的搜索)。 有些搜索将搜索特定数据库中的值,其他搜索将搜索所有数据库中的值

我可以想出两种方法来实现这一点:

  • 创建一个大索引并添加一个名为database_id的字段。在查询某些特定数据库时使用此字段

  • 为每个数据库创建一个索引。当查询一个数据库时,我将只将查询指向一个索引,当查询所有数据库时,我将使用对所有索引运行查询的MultiReader

  • 选项2对我来说似乎更舒服,因为当只查询一个数据库时,维护更容易,查询更快。我还看到一些帖子说低基数字段不利于lucene的性能(有人能解释一下吗?这是真的吗?)

    我想听听社区的想法,还有什么其他的优点和缺点