Text 从ElasticSearch文档检索分析过的标记_Text_<img Src="//i.stack.imgur.com/RUiNP.png" Height="16" Width="18" Alt="" Class="sponsor Tag Img">elasticsearch_Tokenize

Text 从ElasticSearch文档检索分析过的标记

text

Text 从ElasticSearch文档检索分析过的标记,text,elasticsearch,tokenize,Text,elasticsearch,Tokenize,尝试访问ElasticSearch文档中的分析/标记化文本我知道您可以使用分析模块来分析任意文本。因此，我可以将文档中的数据复制并粘贴到AnalyzeAPI中，以查看它是如何标记的不过，这似乎不必要地耗费时间。是否有任何方法指示ElasticSearch在搜索结果中返回标记化文本？我查看了文档，没有发现任何东西。看看这个其他答案：。不幸的是，它需要使用提供的脚本实时重新分析字段内容。应该可以编写插件来公开此功能。我们的想法是将两个端点添加到：允许像solr一样阅读lucene Term

尝试访问ElasticSearch文档中的分析/标记化文本

我知道您可以使用分析模块来分析任意文本。因此，我可以将文档中的数据复制并粘贴到AnalyzeAPI中，以查看它是如何标记的

不过，这似乎不必要地耗费时间。是否有任何方法指示ElasticSearch在搜索结果中返回标记化文本？我查看了文档，没有发现任何东西。

看看这个其他答案：。不幸的是，它需要使用提供的脚本实时重新分析字段内容。
应该可以编写插件来公开此功能。我们的想法是将两个端点添加到：

允许像solr一样阅读lucene TermsEnum，这对提出自动建议也很有用。请注意，它不是每个文档，而是索引上的每个术语，具有术语频率和文档频率（由于有许多独特的术语，可能会很昂贵）
允许读取术语向量（如果启用），就像solr一样。这将是每个文档，但需要存储术语向量（您可以在映射中配置它），并且如果启用，还允许检索位置和偏移量

term\u vector

curl 'http://localhost:9200/your_index/your_type/_search?pretty=true' -d '{
    "query" : {
        "match_all" : { }
    },
    "script_fields": {
        "terms" : {
            "script": "doc[field].values",
            "params": {
                "field": "field_x.field_y"
            }
        }
    }
}'