lucene中的自定义跨度计算

lucene中的自定义跨度计算,lucene,Lucene,我用lucene编写了一个插件,它以这种方式注释某些术语并存储它们的跨度 现在我只需要使用这些跨度而不是默认的lucene存储的跨度来处理span near查询。这是因为并非所有相似的术语都有注释。所以基本上,如果我在k个标记中查询术语,那么我应该能够通过减去它们相应的跨度来获得它们的跨度距离。我怎样才能在lucene做到这一点?我是个新手,所以请尽量描述 谢谢, Ananth.我在Lucene中遵循的一个很好的一般规则是将经过特殊处理的数据放入自己的字段中,这样就不会有混淆的机会。这样,您就可

我用lucene编写了一个插件,它以这种方式注释某些术语并存储它们的跨度

现在我只需要使用这些跨度而不是默认的lucene存储的跨度来处理span near查询。这是因为并非所有相似的术语都有注释。所以基本上,如果我在k个标记中查询术语,那么我应该能够通过减去它们相应的跨度来获得它们的跨度距离。我怎样才能在lucene做到这一点?我是个新手,所以请尽量描述

谢谢,
Ananth.

我在Lucene中遵循的一个很好的一般规则是将经过特殊处理的数据放入自己的字段中,这样就不会有混淆的机会。这样,您就可以按照自己的方式执行近距查询。(这将使您的索引更大。)

您好,注释存储在不同的字段中,但我不知道这将如何帮助我们计算跨度?例如,这里有一段文字
微软总部在雷德蒙
。Lucene有一个名为
company
的字段,其中包含术语
Microsoft,0
,另一个名为
hq
的字段,其中包含术语
Redmond,5
。因为这些字段完全不同,所以lucene的近邻查询不会有帮助,对吗?那么,我如何以一种特殊的方式进行距离计算呢?我不知道我解释得是否正确。如果我不清醒,一定要告诉我。