Apache flink Flink:如何配置Flink,使TaskManager在发生故障后自动重新启动?

Apache flink Flink:如何配置Flink,使TaskManager在发生故障后自动重新启动?,apache-flink,flink-streaming,Apache Flink,Flink Streaming,如何配置Flink,使TaskManager在出现故障后自动重新启动?On和kubernetes Flink有一个本机资源管理器(YarnResourceManager和KubernetesResourceManager),将安排请求的可用插槽数。在其他环境中,您需要使用特定于集群框架的机制来自己解决这个问题 请注意,对于k8s,这个新的、更多由KubernetesResourceManager实现的组件只支持会话集群。作业集群仍然需要以老式的方式进行管理,如中所述 还有一些托管Flink环境,

如何配置Flink,使TaskManager在出现故障后自动重新启动?

On和kubernetes Flink有一个本机资源管理器(
YarnResourceManager
KubernetesResourceManager
),将安排请求的可用插槽数。在其他环境中,您需要使用特定于集群框架的机制来自己解决这个问题

请注意,对于k8s,这个新的、更多由
KubernetesResourceManager
实现的组件只支持会话集群。作业集群仍然需要以老式的方式进行管理,如中所述


还有一些托管Flink环境,您可以在这些环境中处理这些细节,例如Ververica平台或Kinesis数据分析。

您是否检查过?@ArvidHeise是否真的定义了重启策略?例如,考虑一个独立的集群,其中托管TM的机器已经失败。@ ARVIDHISE重启策略是从检查点重新启动一个作业。我问的是任务管理器本身的自动重启,而不是作业。然后请添加您的环境。部署的类型不同。我认为Flink HA独立于环境。我的问题是针对弗林克的。比如说windows上的本地集群。问题很简单,答案也应该是这样。我看到HA通过zookeeper为Jobmanager提供健壮性。但是taskmanager呢。所以我希望它足够清楚。