Flink1.32 akka.tcp

Flink1.32 akka.tcp,akka,apache-flink,Akka,Apache Flink,启动群集时,将按如下方式登录TaskManager: INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试1,超时:500 毫秒) INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:

启动群集时,将按如下方式登录TaskManager:

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试1,超时:500 毫秒)

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试2,超时: 1000毫秒)

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试3,超时: 2000毫秒)

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试4,超时: 8000毫秒)

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试5,超时: 16000毫秒)

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试6,超时: 30000毫秒)

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试7,超时: 30000毫秒)

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试8,超时: 30000毫秒)

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试9,超时: 30000毫秒)

INFO org.apache.flink.runtime.taskmanager.taskmanager- 正在尝试在JobManager注册 阿克卡。tcp://flink@master1:6123/用户/作业管理器(尝试10,超时: 30000毫秒)

似乎无法与JobManger取得联系,但web Ui可以看到TaskManager。 当我向集群提交作业时,JobManager会收到一些错误日志:

引起 :akka.pattern.AskTimeoutException:Recipient[Actor][akka://flink/deadLetters]] 已经被终止了

我猜akka犯了一些错误,但我不知道如何解决它。
非常感谢你帮我

最后,我自己解决了这个问题。flink 1.3.x中有一个bug,您的集群主机不能包含特殊字符


在我的生产环境中,主机被称为“flink_master”“slaves_01”“slaves_02”。这个问题是由“u”引起的。看起来您只能使用字母数字和数字字符。当我将主机更改为“master”、“salves1”和“slaves2”时,效果很好。

您的群集是由谁启动的?您是否可以从TaskManager主机访问主控程序(例如,
telnet master1 6123
应该可以工作)?群集已启动,我可以在web UI中看到TaskManager,TaskManager也可以从telnet master1 6123成功访问。但是web UI中的TaskManager似乎不正确,选项卡,标题行是akka://flink/deadLetters 不是正确的Ip和端口JobManager日志看起来如何?如果您至少可以在web UI上看到一些东西,则意味着JobManager了解任务管理器。我的集群是独立模型。最后一个日志显示如下:-在slaves\u 03注册TaskManager(akka://flink/deadLetters)同87xxxxxxx4d。当前已注册主机的数量为4。当前活动任务插槽的数量为24。在从机_04上注册TaskManager(akka://flink/deadLetters)同51xxxxxxx5c。当前注册主机的数量是4。当前活动任务插槽的数量是32----我认为错误是,但我的测试集群中的flink-conf.yaml与工作集群中的flink-conf.yaml是相同的。网络可用我发现了这一点,我也发现了同样的错误,但我都是这样做的,这不符合ternice查找。flink bug数据库中已经有bug了吗?如果你不想随便创造一个:弗林克兄弟真的很好,总是乐于助人;-)