Apache zookeeper 无法与ZooKeeper通话-更新已禁用

Apache zookeeper 无法与ZooKeeper通话-更新已禁用,apache-zookeeper,solrcloud,Apache Zookeeper,Solrcloud,我们与Zoo Keeper面临一个特殊问题,ZK突然失去与solr cloud的连接,并开始抛出一个异常,该异常表示“无法与Zoo Keeper通话-更新被禁用。” 我们的应用程序在2个不同的数据中心上分别设置了2个solr群集。这些集群中的每一个都有相同的配置和数据,并期望承担相同的增量负载。应用程序用户需要他们所做的更改来反映在搜索中,几乎立即生效,因此我们每10秒运行一次增量加载。话虽如此,在理想情况下,这10秒内的数据更新不会超过10000次 在仲裁中设置3个动物园管理员,每个数据中心配

我们与Zoo Keeper面临一个特殊问题,ZK突然失去与solr cloud的连接,并开始抛出一个异常,该异常表示“无法与Zoo Keeper通话-更新被禁用。”

我们的应用程序在2个不同的数据中心上分别设置了2个solr群集。这些集群中的每一个都有相同的配置和数据,并期望承担相同的增量负载。应用程序用户需要他们所做的更改来反映在搜索中,几乎立即生效,因此我们每10秒运行一次增量加载。话虽如此,在理想情况下,这10秒内的数据更新不会超过10000次

在仲裁中设置3个动物园管理员,每个数据中心配备专用服务器。现在,有了这样的集合,我们最近在一个数据中心遇到了前面提到的问题。ZK突然下降,无法自行恢复。奇怪的是,这只发生在一个数据中心,而两个DC共享相同的负载

虽然它没有影响索引的搜索,但它用失败通知轰炸了应用程序团队(因为特定于应用程序的通知设置)

我们做了什么来处理这个问题? 答:为了阻止邮件泛滥,我们已经停止了大约5分钟的增量作业,然后恢复它们

我们观察到了什么?(也可能是错误的理解。请更正) 答:停止作业可以让ZK在某个时候恢复自身,从而使增量作业在恢复时正常运行。不需要重新启动Solr Cloud的任何ZK

我们想知道什么? 问:在这段时间内,ZK过载没有发生什么异常情况。那么是什么可能导致ZK自身关闭呢

如果有人能帮助我理解这种意外行为的根本原因,那将是非常有帮助的

提前谢谢