Apache flink 使用单个JobManager进行恢复

Apache flink 使用单个JobManager进行恢复,apache-flink,Apache Flink,我正在尝试恢复我的作业,并在我的作业管理器出现故障且无法成功重新启动作业时声明 据我所知,TaskManager恢复是由JobManager协助完成的(正如预期的那样),JobManager恢复是通过Zookeeper完成的 我想知道是否有办法在没有动物园管理员的情况下恢复jobmanager 我正在使用docker进行设置,所有检查点和保存点都会持久化到映射卷 当所有的工作经理都倒下时,弗林克能康复吗?我可以等待单个JobManager重新启动 重新启动jobmanager时,出现以下异常:o

我正在尝试恢复我的作业,并在我的作业管理器出现故障且无法成功重新启动作业时声明

据我所知,TaskManager恢复是由JobManager协助完成的(正如预期的那样),JobManager恢复是通过Zookeeper完成的

我想知道是否有办法在没有动物园管理员的情况下恢复jobmanager

我正在使用docker进行设置,所有检查点和保存点都会持久化到映射卷

当所有的工作经理都倒下时,弗林克能康复吗?我可以等待单个JobManager重新启动

重新启动jobmanager时,出现以下异常:
org.apache.flink.runtime.rest.NotFoundException:Job 446f4392adc32f8e7ba405a474b49e32找不到

我在我的
flink-conf.yaml中设置了以下内容

state.backend: filesystem
state.checkpoints.dir: file:///opt/flink/checkpoints
state.savepoints.dir: file:///opt/flink/savepoints

我认为我的问题可能是重新启动作业管理器时JAR会被删除,但我不确定如何解决这个问题。

目前,如果您使用ZooKeeper,Flink只支持从
作业管理器故障中恢复。但是,理论上,如果您可以保证只有一个
JobManager
运行,那么您也可以在没有它的情况下让它工作。有关详细信息,请参阅此部分。

您可以将群集作为“Flink作业群集”运行。当容器出现时,这将自动启动烘焙到docker图像中的作业。您可以阅读更多。

我是否可以使用Zookeeper并等待单个jobmanager重新启动?或者我必须有一个备用的空转吗?有一个重新启动的
JobManager
就可以了。