Java Lucene术语频率向量

Java Lucene术语频率向量,java,vector,lucene,term,Java,Vector,Lucene,Term,如果我在使用TermVector.YES选项创建的索引上调用IndexReader.getTermFrequenciesVector(…),我会得到什么?正如Xodorap在评论中所指出的那样,已经回答了这个问题 返回的TermFreqVector对象可以检索字段包含哪些术语(分析器生成的单词)以及每个术语在该字段中存在的次数 如果使用TermVector.WITH_offset、TermVector.WITH_POSITIONS或TermVector.WITH_POSITIONS\u offs

如果我在使用
TermVector.YES
选项创建的索引上调用
IndexReader.getTermFrequenciesVector(…)
,我会得到什么?

正如Xodorap在评论中所指出的那样,已经回答了这个问题

返回的
TermFreqVector
对象可以检索字段包含哪些术语(分析器生成的单词)以及每个术语在该字段中存在的次数

如果使用
TermVector.WITH_offset
TermVector.WITH_POSITIONS
TermVector.WITH_POSITIONS\u offset
对字段进行索引,则可以将返回的
TermFreqVector
强制转换到接口
TermPositionVector
。这使您可以访问
GetTermPositions
,允许您检查术语在字段中的位置,以及
GetOffsets
允许您检查术语在原始内容中的来源。后者允许在搜索查询中突出显示匹配的术语,并与
Store.YES
结合使用


在。

的Contrib区域下提供了不同的已贡献的高亮灯,或者您可以实现邻近或首次出现类型的分数贡献。哪种突出显示对您毫无帮助。

您的意思是什么?你是否有一个特定的问题,而他们没有回答?