Java 在Lucene索引中存储间隔

Java 在Lucene索引中存储间隔,java,lucene,full-text-search,information-retrieval,Java,Lucene,Full Text Search,Information Retrieval,我有带注释区域的文档,比如,“标题”、“正文”和“注释”区域也可以嵌套。 我想在“标题”区域搜索“奥巴马”一词。我可以在同一位置使用类似于单词:'Obama'和区域:'title'的span查询匹配,但这意味着我需要为文档中的每个单词位置存储区域属性。我可以将区域存储为区间坐标,然后仅在这些区间内执行查询吗?这看起来很混乱,但您可以将每个单词的区间存储为杜威十进制编码的层次结构,如我所见,这将允许您在层次结构的任何部分搜索该单词所有文本,所有标题,仅标题语义,等等。听起来有点像是在模拟使用单独的

我有带注释区域的文档,比如,“标题”、“正文”和“注释”区域也可以嵌套。
我想在“标题”区域搜索“奥巴马”一词。我可以在同一位置使用类似于单词:'Obama'和区域:'title'的span查询匹配,但这意味着我需要为文档中的每个单词位置存储区域属性。我可以将区域存储为区间坐标,然后仅在这些区间内执行查询吗?

这看起来很混乱,但您可以将每个单词的区间存储为杜威十进制编码的层次结构,如我所见,这将允许您在层次结构的任何部分搜索该单词所有文本,所有标题,仅标题语义,等等。

听起来有点像是在模拟使用单独的字段。例如,有什么原因不能将标题作为单独的字段索引吗?谢谢,这确实是一个选项。但问题是:我的索引内容是专门化的,对于每个单词的位置,都会创建几个字段,例如语法、引理、语义、标点符号前/后,其中一些字段是设置属性,而且非常大。我不能仅仅将字段重命名为title\u语法、title\u语义、body\u语法、body\u语义等-这将导致太大的空间开销。请注意,某些分区可以嵌套。