Lucene中的倒排索引

Lucene中的倒排索引,lucene,inverted-index,Lucene,Inverted Index,我想知道Lucene中哪个类生成反向索引 感谢An是使用的数据文件的结构。实际上并没有任何特殊的类使它反转。包中的类管理最终使数据结构成为反向索引的文件。让我们来分析一下lucene的一些基本原理 索引包含一系列文档 文档是一系列字段 字段是术语的命名序列 术语是字符串 所以,当字段添加到文档中时,如果它们被反转,那么它们将被索引,请注意,字段可以被索引和存储 因此,反转(索引)操作发生在字段级别,yeah是一个类,我认为反转就是在这个类中发生的反转索引是在名为FreqProxTermsWr

我想知道Lucene中哪个类生成反向索引


感谢

An是使用的数据文件的结构。实际上并没有任何特殊的类使它反转。包中的类管理最终使数据结构成为反向索引的文件。

让我们来分析一下lucene的一些基本原理

索引包含一系列文档

  • 文档是一系列字段
  • 字段是术语的命名序列
  • 术语是字符串
所以,当字段添加到文档中时,如果它们被反转,那么它们将被索引,请注意,字段可以被索引和存储


因此,反转(索引)操作发生在字段级别,yeah是一个类,我认为反转就是在这个类中发生的

反转索引是在名为
FreqProxTermsWriter
的类中创建的,基于从文档检索到的信息,例如术语频率、文档频率、术语位置等。

我知道,但是lucene首先将每个文档作为一组字段和同名的处理字段一起读取,然后将每个新字段写入缓冲区。我想知道在这之后它会做什么??确切地说,你的答案有潜力,并且包含一些有用的信息,但是有一些打字错误和语法问题使它很难理解。请更正,也许可以澄清。(如果修正,我的否决票将被删除/更改为否决票。)