Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/ms-access/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Lucene索引中的Hash算法_Hash_Lucene_Indexing - Fatal编程技术网

Lucene索引中的Hash算法

Lucene索引中的Hash算法,hash,lucene,indexing,Hash,Lucene,Indexing,在为lucene中的每个单词编制索引时,如果知道使用哪种哈希算法,lucene不会使用哈希来查找术语,它们会按字典顺序存储在一个名为术语字典的文件中。另一个名为“术语信息索引”的文件加载到内存中,以提供对术语词典(基本上是一个跳过列表)的随机访问 有关的更多信息 目前,术语信息索引存储每个indexdivisor th(通常为indexdivisor=128)在内存中的位置,这意味着您可以通过对术语信息索引(内存中)执行一次二进制搜索来查找术语,并在术语词典(磁盘上)上最多扫描128个条目

在为lucene中的每个单词编制索引时,如果知道使用哪种哈希算法,lucene不会使用哈希来查找术语,它们会按字典顺序存储在一个名为术语字典的文件中。另一个名为“术语信息索引”的文件加载到内存中,以提供对术语词典(基本上是一个跳过列表)的随机访问

有关的更多信息

目前,术语信息索引存储每个indexdivisor th(通常为indexdivisor=128)在内存中的位置,这意味着您可以通过对术语信息索引(内存中)执行一次二进制搜索来查找术语,并在术语词典(磁盘上)上最多扫描128个条目

对于这个术语信息索引,有一个优化(目前在trunk中可用),它使用前缀来执行查找,对于术语字典密集型查询,它的性能要好得多