elasticsearch elasticsearch中的快速关键词提取,elasticsearch,nlp,keyword-search,elasticsearch,Nlp,Keyword Search" /> elasticsearch elasticsearch中的快速关键词提取,elasticsearch,nlp,keyword-search,elasticsearch,Nlp,Keyword Search" />

elasticsearch elasticsearch中的快速关键词提取

elasticsearch elasticsearch中的快速关键词提取,elasticsearch,nlp,keyword-search,elasticsearch,Nlp,Keyword Search,我有一个大型的图像注释数据库,存储在elasticsearch数据库中。我想用这个数据库来提取关键字。输入是文本(通常是报纸文章)。我对算法的基本想法是遍历文章中的每个术语,并使用elasticsearch来发现该术语在图像注释中的频率。然后从不常用的文章中输出术语(以便更喜欢人名或地名而不是普通的英语单词) 我不需要非常复杂的东西,这些关键字只是作为用户输入的建议,但我想要比向elasticsearch询问N个搜索查询(其中N是文本中的词条数)更快的东西,而elasticsearch在大文本上

我有一个大型的图像注释数据库,存储在elasticsearch数据库中。我想用这个数据库来提取关键字。输入是文本(通常是报纸文章)。我对算法的基本想法是遍历文章中的每个术语,并使用elasticsearch来发现该术语在图像注释中的频率。然后从不常用的文章中输出术语(以便更喜欢人名或地名而不是普通的英语单词)


我不需要非常复杂的东西,这些关键字只是作为用户输入的建议,但我想要比向elasticsearch询问N个搜索查询(其中N是文本中的词条数)更快的东西,而elasticsearch在大文本上可能会比较慢。在elasticsearch中是否有一些健壮而快速的关键字提取技术?

您可以使用elastic search进行此操作。它们可以返回带有文档计数的带扣关键字,文档计数表示它们的相对频率。下面是一个YML查询示例

query:
    match:
        annotation:
            query: text of your article
aggregations:
    term_frequencies:
        terms:
            field: annotation

这对我的数据非常有效。。有一大堆停止语。这需要不同的方法。