elasticsearch 获取文本字段中使用最多的前10个单词,elasticsearch,kibana,elasticsearch,Kibana" /> elasticsearch 获取文本字段中使用最多的前10个单词,elasticsearch,kibana,elasticsearch,Kibana" />

elasticsearch 获取文本字段中使用最多的前10个单词

elasticsearch 获取文本字段中使用最多的前10个单词,elasticsearch,kibana,elasticsearch,Kibana,我有一个包含数千个文档的索引,每个文档都有一个全文字段 我想搜索所有这些字段,找出最常出现的10个最常见的单词 如果可能的话,我还想在Kibana上看到它。实现这一点最常用的方法是使用关键字数据类型复制全文字段。这将使您能够在该字段上进行术语聚合。也许你可以考虑做一个重要的术语聚合< /代码>,这样就避免了停用词和常用词的出现。在ES 6.x中,您也可以使用重要文本聚合-,而无需创建关键字字段,但我从未尝试过,我不知道它是如何工作的。相反,如果需要检索每个文档的单词频率,则应使用术语向量-

我有一个包含数千个文档的索引,每个文档都有一个全文字段

我想搜索所有这些字段,找出最常出现的10个最常见的单词


如果可能的话,我还想在Kibana上看到它。

实现这一点最常用的方法是使用
关键字数据类型复制全文字段。这将使您能够在该字段上进行
术语聚合
。也许你可以考虑做一个<代码>重要的术语聚合< /代码>,这样就避免了停用词和常用词的出现。在ES 6.x中,您也可以使用
重要文本聚合
-,而无需创建
关键字
字段,但我从未尝试过,我不知道它是如何工作的。相反,如果需要检索每个文档的单词频率,则应使用
术语向量
-