Lucene索引中的Hash算法
在为lucene中的每个单词编制索引时,如果知道使用哪种哈希算法,lucene不会使用哈希来查找术语,它们会按字典顺序存储在一个名为术语字典的文件中。另一个名为“术语信息索引”的文件加载到内存中,以提供对术语词典(基本上是一个跳过列表)的随机访问 有关的更多信息 目前,术语信息索引存储每个indexdivisor th(通常为indexdivisor=128)在内存中的位置,这意味着您可以通过对术语信息索引(内存中)执行一次二进制搜索来查找术语,并在术语词典(磁盘上)上最多扫描128个条目Lucene索引中的Hash算法,hash,lucene,indexing,Hash,Lucene,Indexing,在为lucene中的每个单词编制索引时,如果知道使用哪种哈希算法,lucene不会使用哈希来查找术语,它们会按字典顺序存储在一个名为术语字典的文件中。另一个名为“术语信息索引”的文件加载到内存中,以提供对术语词典(基本上是一个跳过列表)的随机访问 有关的更多信息 目前,术语信息索引存储每个indexdivisor th(通常为indexdivisor=128)在内存中的位置,这意味着您可以通过对术语信息索引(内存中)执行一次二进制搜索来查找术语,并在术语词典(磁盘上)上最多扫描128个条目