elasticsearch 为什么Elasticsearch word_delimiter_图形的工作方式与预期不同?,elasticsearch,nlp,full-text-search,elasticsearch,Nlp,Full Text Search" /> elasticsearch 为什么Elasticsearch word_delimiter_图形的工作方式与预期不同?,elasticsearch,nlp,full-text-search,elasticsearch,Nlp,Full Text Search" />

elasticsearch 为什么Elasticsearch word_delimiter_图形的工作方式与预期不同?

elasticsearch 为什么Elasticsearch word_delimiter_图形的工作方式与预期不同?,elasticsearch,nlp,full-text-search,elasticsearch,Nlp,Full Text Search,“word\u delimiter\u graph最酷的地方在于,如果positionLength不是1,那么它会对positionLength进行索引 我使用单词定界符图和生成单词部分为FooBar Baz编制了索引:“true”,“preserve\u original”:“true”,“split\u on\u case\u change”:“true”,其标记如下: pos 0 foobar (positionLength 2) pos 0 foo pos 1 bar pos 2 b

“word\u delimiter\u graph最酷的地方在于,如果positionLength不是1,那么它会对positionLength进行索引

我使用
单词定界符图
生成单词部分为
FooBar Baz编制了索引:“true”,“preserve\u original”:“true”,“split\u on\u case\u change”:“true”
,其标记如下:

pos 0 foobar  (positionLength 2)
pos 0 foo 
pos 1 bar
pos 2 baz
如果我对
“foobar baz”
进行短语搜索,我的搜索分析器(标准分析器)将使用以下标记:

pos 0 foobar
pos 1 baz
如果positionLength是有意义的,那么我认为这个搜索应该匹配索引文本,但是它没有


你知道我做错了什么吗?

word\u delimiter\u graph
没有完全实现,对于Elasticsearch文档中显示的“更好的”匹配短语搜索没有用处

根据正在进行的讨论issues.apache.org/jira/browse/LUCENE-4312,
positionLength
没有索引,因此
word\u delimiter\u graph
令牌存储在磁盘上与
word\u delimiter
令牌没有什么不同。即使这些信息被编入索引,我们也无法使用它,直到建立相应的搜索代码

相关的

word\u delimiter\u graph
没有完全实现,对于Elasticsearch文档中显示的“更好的”匹配短语搜索没有用处

根据正在进行的讨论issues.apache.org/jira/browse/LUCENE-4312,
positionLength
没有索引,因此
word\u delimiter\u graph
令牌存储在磁盘上与
word\u delimiter
令牌没有什么不同。即使这些信息被编入索引,我们也无法使用它,直到建立相应的搜索代码

相关的
这个lucene问题是相关的,它似乎表明
positionLength
没有索引。因此,
word\u delimiter
word\u delimiter\u图形的索引是相同的。这个lucene问题是相关的,它似乎表明
positionLength
没有索引。因此,
word\u delimiter
word\u delimiter\u图形的索引是相同的。