Indexing 合并对索引的影响
我的solrconfig.xml配置如下:Indexing 合并对索引的影响,indexing,solr,Indexing,Solr,我的solrconfig.xml配置如下: <mainIndex> <useCompoundFile>false</useCompoundFile> <ramBufferSizeMB>32</ramBufferSizeMB> <mergeFactor>5</mergeFactor> <maxMergeDocs>10</maxMergeDocs> <
<mainIndex>
<useCompoundFile>false</useCompoundFile>
<ramBufferSizeMB>32</ramBufferSizeMB>
<mergeFactor>5</mergeFactor>
<maxMergeDocs>10</maxMergeDocs>
<maxFieldLength>10000</maxFieldLength>
<unlockOnStartup>false</unlockOnStartup>
</mainIndex>
错误的
32
5.
10
10000
错误的
索引大小为12mb。但是当我改变我的合并因子时,我在我的索引中没有发现任何影响,也就是说,段的数量是完全相同的。我不知道哪种配置会影响段数。我想这是一个重要的因素。
我的下一个问题是,哪个配置定义了每个段的文档数量,以及这个段的大小,以便创建下一个段
对于您的问题,请让我明确以下几点:
- 合并因子:如果合并因子为10。。每10个文档将有一个新的段,最多10个段,每个段添加到100个段中,以此类推
- MaxMergeDocs为您提供了一个段在开始合并到新段之前可以接受的最大文档数
如果使用dataImportHandler,请确保在完全导入时不会自动优化为maxSegments=1以查看效果。@fyr:为什么,当我更改合并因子时,我无法查看索引上的效果可能是因为您的测试集或参数不合适。使用合并因子2和maxMergeDocs 10000以及合并因子2和maxMergeDocs 100对其进行测试。在这两种情况下,索引1000个文档将有所不同。@fyr:正如您在中所看到的,我只有2881个文档,比查看效果的配置要多。是否使用我的参数和1000个文档的子集对其进行测试?是的,我已使用您的参数进行了测试。但我的感觉是,如果我只有2881个文档,那么它只会创建一个段,合并因子不会影响这些文档的数量。请看