elasticsearch elasticsearch/lucene是否会对fieldcache中缺少的值施加内存开销?,elasticsearch,lucene,elasticsearch,Lucene" /> elasticsearch elasticsearch/lucene是否会对fieldcache中缺少的值施加内存开销?,elasticsearch,lucene,elasticsearch,Lucene" />

elasticsearch elasticsearch/lucene是否会对fieldcache中缺少的值施加内存开销?

elasticsearch elasticsearch/lucene是否会对fieldcache中缺少的值施加内存开销?,elasticsearch,lucene,elasticsearch,Lucene,这个问题主要针对Elasticsearch,但我相信答案将基于潜在的Lucene语义 我正在考虑在同一个索引中使用多种类型。许多字段将是可排序的,并且许多字段将仅由一种特定类型使用。即:字段将是稀疏的,平均覆盖率为10% 由于排序将所有文档的值保留在内存中(与类型有关),我想知道,在Elasticsearch官方博客上最近发表的一篇题为,作者解决了一个常见的问题,当涉及到选择是否要使用几个索引或几种类型对数据建模时 一个事实是Lucene指数不喜欢稀疏性。因此,作者说 一种类型中存在的字段也将消

这个问题主要针对Elasticsearch,但我相信答案将基于潜在的Lucene语义

我正在考虑在同一个索引中使用多种类型。许多字段将是可排序的,并且许多字段将仅由一种特定类型使用。即:字段将是稀疏的,平均覆盖率为10%


由于排序将所有文档的值保留在内存中(与类型有关),我想知道,在Elasticsearch官方博客上最近发表的一篇题为,作者解决了一个常见的问题,当涉及到选择是否要使用几个索引或几种类型对数据建模时

一个事实是Lucene指数不喜欢稀疏性。因此,作者说

一种类型中存在的字段也将消耗该字段不存在的文档类型的资源。[…]而文档值的问题更为严重:出于速度原因,文档值通常为每个文档保留固定数量的磁盘空间,因此可以有效地处理值

有一个旨在改善这种情况的解决方案,已在5.4中修复,将在Elasticsearch v2.2中提供。即使如此,作者建议仍然以尽可能限制稀疏性的方式对数据进行建模