elasticsearch 是否可以在ElasticSearch中返回分析的字段>;2.0搜索?,elasticsearch,lucene,nlp,elasticsearch,Lucene,Nlp" /> elasticsearch 是否可以在ElasticSearch中返回分析的字段>;2.0搜索?,elasticsearch,lucene,nlp,elasticsearch,Lucene,Nlp" />

elasticsearch 是否可以在ElasticSearch中返回分析的字段>;2.0搜索?

elasticsearch 是否可以在ElasticSearch中返回分析的字段>;2.0搜索?,elasticsearch,lucene,nlp,elasticsearch,Lucene,Nlp,这个问题感觉非常类似于这里发布的一个老问题:,但为了看看是否有任何变化,我认为再次发布最新版本的ElasticSearch是有意义的 我们正在尝试使用ElasticSearch内置的snowball词干分析器,通过搜索查询和字段映射来搜索ElasticSearch中的文本正文。性能和结果都很好,但是因为我们需要有词干文本正文进行后期分析,所以我们希望搜索结果为搜索结果中每个文档的文本字段返回实际的词干标记 该字段的映射当前如下所示: "TitleEnglish": {

这个问题感觉非常类似于这里发布的一个老问题:,但为了看看是否有任何变化,我认为再次发布最新版本的ElasticSearch是有意义的

我们正在尝试使用ElasticSearch内置的snowball词干分析器,通过搜索查询和字段映射来搜索ElasticSearch中的文本正文。性能和结果都很好,但是因为我们需要有词干文本正文进行后期分析,所以我们希望搜索结果为搜索结果中每个文档的文本字段返回实际的词干标记

该字段的映射当前如下所示:

      "TitleEnglish": {
        "type": "string",
        "analyzer": "standard",
        "fields": {
          "english": {
            "type": "string",
            "analyzer": "english"
          },
          "stemming": {
            "type": "string",
            "analyzer": "snowball"
          }
        }
      }
搜索查询专门在TitleEnglish.stemming上执行。理想情况下,我希望它返回该字段,但返回的不是分析的字段,而是原始字段

有人知道怎么做吗?我们已经看过了,但它们似乎只可以返回单个文档或文档体,而不能返回搜索结果

或者像Solr或Sphinx这样的其他解决方案也提供了这个选项


添加一些额外的信息。如果我们运行以下查询:

GET /_analyze?analyzer=snowball&text=Eight issue of Industrial Lorestan eliminate barriers to facilitate the Committees review of

它返回带词干的单词:
eight
issu
industri
,等等。这正是我们希望为文本中所有单词的每个匹配文档返回的结果(不仅仅是匹配项)。

除非我遗漏了一些明显的内容,为什么不简单地在
TitleEnglish.stemming
字段中返回a

{
    "query": {...},
    "aggs" : {
        "stems" : {
            "terms" : { 
                "field" : "TitleEnglish.stemming",
                "size": 50
            }
        }
    }
}

将该聚合添加到查询中,您将从与您的查询匹配的文档中获得
TitleEnglish.steming
子字段中所有词干术语的细分。

那么,您链接的问题中的解决方案对您不起作用?它们出了什么问题?向量答案这个术语不是一个实际的解决方案(如上所述)。是的,我看到了,但它没有向我解释任何事情。如果不是文档,那么什么是搜索结果?在我们的情况下,搜索结果是一个文档体(比如:8000个文档)我们不想单独提取这些文档的术语向量,因为这对于实时分析来说太密集了。谢谢你的回答。我已经尝试过了,它肯定适用于你所描述的内容。在文档旁边,它返回搜索返回中存在的所有带词干标记的列表。这并不是我们真正想要的答案,因为我们现在仍然需要解析每个文档并将其映射到其词干成分。因此,您需要为每个文档返回词干标记?是的,这就是我们所追求的情况。如果不清楚,我会更新我最初的问题。