elasticsearch 当查询~10M文档索引和更多问题时,fielddata=true会有什么影响
我有一个大约1000万文档的索引。在每个文档中,我都有一个“文本”字段,在其中输入一个字符串,最后我希望聚合该字段中的所有术语。当尝试这样做时,我只得到整个字符串。 我只听说了使用fielddata=true的不好的地方。 对于这么多的文档,在内存方面使用fielddata=true真的是一种很糟糕的做法吗
elasticsearch 当查询~10M文档索引和更多问题时,fielddata=true会有什么影响,
elasticsearch,aggregation,
elasticsearch,Aggregation,我有一个大约1000万文档的索引。在每个文档中,我都有一个“文本”字段,在其中输入一个字符串,最后我希望聚合该字段中的所有术语。当尝试这样做时,我只得到整个字符串。 我只听说了使用fielddata=true的不好的地方。 对于这么多的文档,在内存方面使用fielddata=true真的是一种很糟糕的做法吗 在索引管道中使用分析器(仅在特定字段上设置分析器)与将分析器用作函数(在字符串上运行分析器,获取结果并将其放入文档)之间是否存在差异(在性能方面) 同义词-我已经定义了一个同义词列表,我相信
你能提供第一点的示例代码吗。我的ES主要用于聚合,在这种情况下它会不会对我的内存影响较小(使用fielddata=true)?2.您可以直接使用分析器(analyzar(input_word)=analyzed word),也可以在特定字段(映射中)上设置分析器,它将自动分析此字段。就性能而言,两者之间有什么区别吗。对当然使用聚合时,您可以了解fielddata使用了多少内存:http://[master IP]:9200/_cat/fielddata?v