Indexing 合并对索引的影响

Indexing 合并对索引的影响,indexing,solr,Indexing,Solr,我的solrconfig.xml配置如下: <mainIndex> <useCompoundFile>false</useCompoundFile> <ramBufferSizeMB>32</ramBufferSizeMB> <mergeFactor>5</mergeFactor> <maxMergeDocs>10</maxMergeDocs> <

我的solrconfig.xml配置如下:

<mainIndex>
   <useCompoundFile>false</useCompoundFile>
    <ramBufferSizeMB>32</ramBufferSizeMB>
    <mergeFactor>5</mergeFactor>
    <maxMergeDocs>10</maxMergeDocs>
    <maxFieldLength>10000</maxFieldLength>
    <unlockOnStartup>false</unlockOnStartup>
  </mainIndex>

错误的
32
5.
10
10000
错误的
索引大小为12mb。但是当我改变我的合并因子时,我在我的索引中没有发现任何影响,也就是说,段的数量是完全相同的。我不知道哪种配置会影响段数。我想这是一个重要的因素。 我的下一个问题是,哪个配置定义了每个段的文档数量,以及这个段的大小,以便创建下一个段

对于您的问题,请让我明确以下几点:

  • 合并因子:如果合并因子为10。。每10个文档将有一个新的段,最多10个段,每个段添加到100个段中,以此类推
  • MaxMergeDocs为您提供了一个段在开始合并到新段之前可以接受的最大文档数
因此,最终两者都会对细分市场产生影响

更新:


如果使用dataImportHandler,请确保在完全导入时不会自动优化为maxSegments=1以查看效果。

@fyr:为什么,当我更改合并因子时,我无法查看索引上的效果可能是因为您的测试集或参数不合适。使用合并因子2和maxMergeDocs 10000以及合并因子2和maxMergeDocs 100对其进行测试。在这两种情况下,索引1000个文档将有所不同。@fyr:正如您在中所看到的,我只有2881个文档,比查看效果的配置要多。是否使用我的参数和1000个文档的子集对其进行测试?是的,我已使用您的参数进行了测试。但我的感觉是,如果我只有2881个文档,那么它只会创建一个段,合并因子不会影响这些文档的数量。请看