Merge MarkLogic:在向现有数据库添加新林时,如何加快重新平衡过程?

Merge MarkLogic:在向现有数据库添加新林时,如何加快重新平衡过程?,merge,nosql,marklogic,marklogic-8,rebalancing,Merge,Nosql,Marklogic,Marklogic 8,Rebalancing,我们的生产MarkLogic DB在6个林中划分了1.2 TB的数据。我们计划增加2片新森林,以减少每片森林的林分数量 现在,添加新的森林开始重新平衡数据。没关系,这需要时间。但是,每当合并开始时,再平衡的时间就一直在加快。有时,估计需要8小时到16小时。因此,整个过程平均需要大约24小时 我的问题是-如果我们在添加新林之前禁用合并,并在重新平衡完成后(添加林之后)立即启用手动合并,合并过程会更快吗?而且,这样做是否安全?任何影响磁盘IO的因素都会影响重新平衡的速度,包括合并和标准数据库活动,但

我们的生产MarkLogic DB在6个林中划分了1.2 TB的数据。我们计划增加2片新森林,以减少每片森林的林分数量

现在,添加新的森林开始重新平衡数据。没关系,这需要时间。但是,每当合并开始时,再平衡的时间就一直在加快。有时,估计需要8小时到16小时。因此,整个过程平均需要大约24小时


我的问题是-如果我们在添加新林之前禁用合并,并在重新平衡完成后(添加林之后)立即启用手动合并,合并过程会更快吗?而且,这样做是否安全?

任何影响磁盘IO的因素都会影响重新平衡的速度,包括合并和标准数据库活动,但如果禁用合并,则应小心

禁用合并的风险在于,您会阻止系统修剪停机位,因此如果累积的停机位太多,您可能会达到硬限制,这将影响服务器的运行

如果合并有如此大的影响,那么您可以考虑调整合并配置。更多信息可在文档中找到


除了提供的其他信息外,分配政策可能会影响完成的工作量。请参见示例:。您还可以设置重新平衡油门,使其在系统无法承受时工作得更慢。但是如果你在重新平衡的同时关闭合并,我敢打赌你会很快遇到一个TOOMANYSTANDS错误,因为因为重新平衡器的缘故,小看台需要写出来,但无法合并到更大+更少的展位。

您也可以尝试设置后台io限制,以帮助限制合并:估计8到16小时加起来不等于24小时。请记住,估计的剩余时间考虑了当前负载。这意味着,当负载增加时,估计值会变大,但当负载减少时,估计值也会变小。如果在典型负载下重新平衡预计需要8小时,我预计需要更长的时间,因为一路上不可避免的合并,但不到16小时,因为合并应该相对较短。顺便留意一下免费空间。谢谢@grtjn。是的,我们已经考虑到避免任何负载。上述统计数据来自UAT,我们在那里休息了一整天。这8到16个小时只是时间上下波动的一个例子,每次重新平衡时出现合并(有时8,9次合并同时发生)时都会发生这种情况。最初,当它开始时,它显示了16个小时的估计。最终在23小时内完成。刚刚检查,自由空间足够。