elasticsearch elasticsearch中的可选字段,elasticsearch,lucene,elasticsearch,Lucene" /> elasticsearch elasticsearch中的可选字段,elasticsearch,lucene,elasticsearch,Lucene" />

elasticsearch elasticsearch中的可选字段

elasticsearch elasticsearch中的可选字段,elasticsearch,lucene,elasticsearch,Lucene,假设1000个文档中只有10个有一个名为limitedEdition的字段,那么对于其他990个没有该字段值的文档limitedEdition,会不会增加一些开销?这些文档在elasticsearch索引中是否会有一个空值/引用,有点像在sql中添加一个可为空的列 {_id:1,category:[4],feature:[1,2]}, {_id:2,category:[5],feature:[3,5]}, {_id:3,category:[7],feature:[2,4]}, ..... {_i

假设1000个文档中只有10个有一个名为
limitedEdition
的字段,那么对于其他990个没有该字段值的文档
limitedEdition
,会不会增加一些开销?这些文档在elasticsearch索引中是否会有一个空值/引用,有点像在sql中添加一个可为空的列

{_id:1,category:[4],feature:[1,2]},
{_id:2,category:[5],feature:[3,5]},
{_id:3,category:[7],feature:[2,4]},
.....
{_id:10,category:[5],limitedEdition:1000}

可索引字段在我的项目中不断增加,因此我必须重新考虑这些稀疏列是应该存储在elasticsearch中还是应该重新组织字段。

虽然这是重复的,但在这方面有一些最新的发展。使用Lucene 7(Elasticsearch 6.0的一部分),文档值的稀疏性提高了很多:

通过这些更改,您最终只需支付实际使用的文档值、索引大小、索引性能等。这与索引的其他部分(如过账、存储字段、术语向量等)相同。,这意味着具有非常稀疏文档值的用户不再看到合并花费了不合理的长时间,或者在合并时索引变得异常巨大

您可以在上看到更改。

Dupe: