Jenkins:2个使用NFS的主节点

Jenkins:2个使用NFS的主节点,jenkins,high-availability,nfs,Jenkins,High Availability,Nfs,我正在考虑为我的环境提供以下高可用性解决方案: 数据中心,其中一个由Jenkins主节点供电 具有一个Jenkins主节点的DeStaters数据中心 数据中心1始终通电,第二个仅用于灾难。我的想法是使用相同的ip安装两个jenkins,但使用共享NFS。如果第一个已下降,第二个将以相同的ip启动,并且我仍能成功获得服务 我的问题是,这个解决方案行得通吗 谢谢大家(由hekp;) 我不认为有任何挑战,为什么它不应该起作用。但在切换的情况下,您仍然需要进行监控,因为我遇到过这样的情况:当jen

我正在考虑为我的环境提供以下高可用性解决方案:

  • 数据中心,其中一个由Jenkins主节点供电

  • 具有一个Jenkins主节点的DeStaters数据中心

数据中心1始终通电,第二个仅用于灾难。我的想法是使用相同的ip安装两个jenkins,但使用共享NFS。如果第一个已下降,第二个将以相同的ip启动,并且我仍能成功获得服务

我的问题是,这个解决方案行得通吗


谢谢大家(由hekp;)

我不认为有任何挑战,为什么它不应该起作用。但在切换的情况下,您仍然需要进行监控,因为我遇到过这样的情况:当jenkins突然关闭时正在运行的作业在服务恢复时仍在队列中,但之后它们从未完成。我必须使用脚本控制台手动删除构建

在jenkins论坛上,很多人都报告了这样的错误,其中大多数似乎已经修复,但仍有可能发生这种情况,因为每次jenkins重启/启动时,配置都会从磁盘重新加载。所以有时会出现不一致,因为内存中的配置在前面,并且重新加载了配置


所以在您的情况下,当服务恢复时,您的执行器线程可能仍然被阻塞。因此,你必须确保恢复后一切正常

我有一个疑问,我知道我在灾难发生的那一刻失去了工作。如果我在变更后执行新作业?会很好吗?是的,会很好。我想在这里介绍的唯一一件事是确保您的执行器线程没有被阻塞。假设您正在为jenkins master使用一个executor线程,并且在恢复之后,该线程可能总是开始拾取它正在运行的上一个构建,在这种情况下,如果该线程被卡住,您甚至无法执行该构建。我指出这一点是因为到目前为止,我已经面对过两次这样的情况。如果不是这样的话,你总是很乐意去。如果你面对这种情况,这可能会有所帮助。据报道,有多起此类事件,我亲眼目睹。