Lucene中的多个索引还是单个索引?

Lucene中的多个索引还是单个索引?,lucene,Lucene,我必须索引应该一起搜索的不同类型的数据(文本文档、论坛消息、用户配置文件数据等)(即,一次搜索将返回不同类型数据的结果) 拥有多个索引(每种数据类型一个索引)的优点和缺点是什么 对所有类型的数据使用单一索引的优缺点是什么 谢谢。不一定要回答你的直接问题,但是…;) 我会使用一个索引,为类型添加一个关键字(索引,存储)字段,如果需要,它会让您进行筛选,并告诉您收到的结果之间的差异 (也许根据你的问题……使用单独的索引可以让每个语料库都有自己的相关性得分,不知道在一个语料库中过度重复的术语是否会

我必须索引应该一起搜索的不同类型的数据(文本文档、论坛消息、用户配置文件数据等)(即,一次搜索将返回不同类型数据的结果)

  • 拥有多个索引(每种数据类型一个索引)的优点和缺点是什么

  • 对所有类型的数据使用单一索引的优缺点是什么


谢谢。

不一定要回答你的直接问题,但是…;)

我会使用一个索引,为类型添加一个关键字(索引,存储)字段,如果需要,它会让您进行筛选,并告诉您收到的结果之间的差异


(也许根据你的问题……使用单独的索引可以让每个语料库都有自己的相关性得分,不知道在一个语料库中过度重复的术语是否会使其他语料库中的文档失去相关性?)

您应该从逻辑上考虑每个数据集包含哪些内容,并根据主题或其他标准(如地理位置、业务单位等)设计索引。一般来说,您的索引体系结构类似于您创建数据库的方式(例如,即使在技术上可行,您也可能不会将会计与人事数据库相结合)

正如@llama所指出的,创建一个单一的优步索引会影响相关性分数、安全性/访问问题等,并导致一系列全新的问题


总之:根据您的业务需要考虑一个逻辑分区结构。如果没有进一步的背景,很难解释。

如果你想用一次搜索来搜索所有类型的文档,最好保留所有类型的文档 类型到一个索引。在索引中,您可以定义更多要标记或向量化的字段类型。 向每个IndexSearcher引入包含索引的目录需要一段时间

如果要单独搜索术语,最好将每种类型索引到一个索引中。 单索引比多索引更具结构性

另一方面,我们可以使用多个索引来平衡负载