Ssh Flink Jobmanager无法查看任务管理器

Ssh Flink Jobmanager无法查看任务管理器,ssh,cluster-computing,apache-flink,Ssh,Cluster Computing,Apache Flink,所以我在我们的网络上安装了一个ApacheFlink集群。我已经完成了如下所示的配置。此主服务器(JobManager)启动,并通过ssh向所有从属服务器发送start命令。我可以看到任务管理器在主节点启动后正在运行 所有节点上的配置文件: jobmanager.rpc.address: flmaster jobmanager.rpc.port: 6123 jobmanager.heap.mb: 1024 taskmanager.heap.mb: 2048 taskmanager.numberO

所以我在我们的网络上安装了一个ApacheFlink集群。我已经完成了如下所示的配置。此主服务器(JobManager)启动,并通过ssh向所有从属服务器发送start命令。我可以看到任务管理器在主节点启动后正在运行

所有节点上的配置文件:

jobmanager.rpc.address: flmaster
jobmanager.rpc.port: 6123
jobmanager.heap.mb: 1024
taskmanager.heap.mb: 2048
taskmanager.numberOfTaskSlots: 1
taskmanager.memory.preallocate: false
parallelism.default: 1
jobmanager.web.port: 8081
taskmanager.tmp.dirs: /apps/storage/runtime/flink/workspace
recovery.mode: zookeeper
recovery.zookeeper.quorum:zk1:2181, zk2:2181, zk3:2181 
recovery.zookeeper.storageDir: /apps/runtime/flink/recovery
env.java.home: /apps/java/
然后我在config文件夹中有一个名为slaves的文件,其中有一个slaves节点列表

flSlave1
flSlave2
flSlave3
然后我开始

../bin/start-cluster.sh
这将打开到所有从属节点的ssh会话,并启动任务管理器。我可以通过ps ax | grep java看到这一点

我可以在flMaster:8081上打开Web Ui 在WebUI上,我可以看到从属节点计数为0。我没有任务管理器。 作为测试,我启动了wordcount.jar作业,它告诉我它无法运行该作业,因为没有打开的插槽

/apps/flink/bin/flink run /apps/flink/examples/batch/WordCount.jar
答复如下:

07/20/2016 13:19:01     Job execution switched to status FAILING.
org.apache.flink.runtime.jobmanager.scheduler.NoResourceAvailableException: Not enough free slots available to run the job.*
我想如果没有任务管理器/从节点,就不会有插槽


有人见过这个问题吗?

尝试在jobmanager机器rpc端口上执行telnet。TaskManager通过rpc与jobmanager对话。因此,请检查网络设置是否能够访问jobmanager和任务管理器的rpc端口


还要检查blob服务器端口。检查taskmanager日志是否能够连接到jobmanager blob服务器。

使用完全限定的主机名而不是短名称。例如hostname.xyx.com,而不仅仅是hostname。或者你也可以尝试使用ip地址。

哇,这是过去的一次爆炸。是的,我就是这样解决的。我用了IP。这是一个坏习惯,因为即使是静态IP最终也会因为任何原因而改变。(如网络团队渴望重做网络等)