按Solr中其他术语的距离/发生率获取术语列表
Solr中是否有一种方法可以通过术语到另一个术语的距离获得术语列表,类似于TermsComponent,它可以通过文档中的术语计数返回术语 例如,如果我对以下文本进行了索引: 那只敏捷的棕色狐狸跳过了那些懒狗 及 狐狸说什么 我搜索了“fox”一词,我希望得到以下结果:按Solr中其他术语的距离/发生率获取术语列表,solr,solr4,Solr,Solr4,Solr中是否有一种方法可以通过术语到另一个术语的距离获得术语列表,类似于TermsComponent,它可以通过文档中的术语计数返回术语 例如,如果我对以下文本进行了索引: 那只敏捷的棕色狐狸跳过了那些懒狗 及 狐狸说什么 我搜索了“fox”一词,我希望得到以下结果: <response> <lst name="responseHeader"> <int name="status">0</int> <
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">7</int>
</lst>
<lst name="terms">
<lst name="text">
<int name="brown">0</int>
<int name="jumped">0</int>
<int name="say">0</int>
<int name="the">1</int>
<int name="quick">1</int>
<int name="over">1</int>
<int name="does">1</int>
<int name="what">2</int>
<int name="lazy">3</int>
<int name="dogs">4</int>
</lst>
</lst>
</response>
0
7.
0
0
0
1.
1.
1.
1.
2.
3.
4.
在这个例子中,我使用一个非常简单的算法来计算值(总单词距离/出现的文档数)。例如,“The”出现在两个文档中,一次距离为0,另一次距离为2,因此(0+2)/2
给出1的答案
再一次,我要问的是,这样的事情是否已经存在,如果不存在,人们将如何去做呢