按Solr中其他术语的距离/发生率获取术语列表

按Solr中其他术语的距离/发生率获取术语列表,solr,solr4,Solr,Solr4,Solr中是否有一种方法可以通过术语到另一个术语的距离获得术语列表,类似于TermsComponent,它可以通过文档中的术语计数返回术语 例如,如果我对以下文本进行了索引: 那只敏捷的棕色狐狸跳过了那些懒狗 及 狐狸说什么 我搜索了“fox”一词,我希望得到以下结果: <response> <lst name="responseHeader"> <int name="status">0</int> <

Solr中是否有一种方法可以通过术语到另一个术语的距离获得术语列表,类似于TermsComponent,它可以通过文档中的术语计数返回术语

例如,如果我对以下文本进行了索引:

那只敏捷的棕色狐狸跳过了那些懒狗

狐狸说什么

我搜索了“fox”一词,我希望得到以下结果:

<response>
    <lst name="responseHeader">
        <int name="status">0</int>
        <int name="QTime">7</int>
    </lst>
    <lst name="terms">
        <lst name="text">
            <int name="brown">0</int>
            <int name="jumped">0</int>
            <int name="say">0</int>
            <int name="the">1</int>
            <int name="quick">1</int>
            <int name="over">1</int>
            <int name="does">1</int>
            <int name="what">2</int>
            <int name="lazy">3</int>
            <int name="dogs">4</int>
        </lst>
    </lst>
</response>

0
7.
0
0
0
1.
1.
1.
1.
2.
3.
4.
在这个例子中,我使用一个非常简单的算法来计算值(总单词距离/出现的文档数)。例如,“The”出现在两个文档中,一次距离为0,另一次距离为2,因此
(0+2)/2
给出1的答案

再一次,我要问的是,这样的事情是否已经存在,如果不存在,人们将如何去做呢