SolrCloud碎片回收

SolrCloud碎片回收,solrcloud,Solrcloud,我是一个SolrCloud新手,我的设置是3个碎片,3个副本,外部Zookeeper 今天我发现了shard3,replica3已经接管了它的领导地位,所以索引是发生在replica3而不是shard3上的。我以相反的顺序停止Tomcat/SOLR(R3、R2、R1、S3、S2、S1),并以相反的顺序重新启动(S1、S2、S3、R1、R2、R3)。我没有删除任何tlog或replication.properties文件。云图显示所有主机的正确分配。据我所知,这些任务是在第一次启动时在Zookee

我是一个SolrCloud新手,我的设置是3个碎片,3个副本,外部Zookeeper

今天我发现了shard3,replica3已经接管了它的领导地位,所以索引是发生在replica3而不是shard3上的。我以相反的顺序停止Tomcat/SOLR(R3、R2、R1、S3、S2、S1),并以相反的顺序重新启动(S1、S2、S3、R1、R2、R3)。我没有删除任何tlog或replication.properties文件。云图显示所有主机的正确分配。据我所知,这些任务是在第一次启动时在Zookeeper中设置的

我的问题是,为replica3编制索引的数据如何回到恢复的shard3

令人惊讶的是,shard3=87G,而replica3=80G

糊涂了

1)据我所知,shard3启动、启动和运行时,zookeeper负责shard和replica3之间的数据同步工作

2) 关于您的第二个问题,可能是replica3处于优化状态,因此您看到的数据量较小,而shard3尚未由SOLR进行优化。(这只是一个猜测)

副本的大小并不重要,重要的是集合中包含的文档数量

Solr的工作方式是,您可以删除集合中仅在合并操作中删除的文档,这额外的7G可以删除文档