如何在使用边缘节点运行Hadoop群集时连接到Impala
我已经使用Cloudera Manager安装了Hadoop集群,目前所有数据节点上都运行着Impala守护进程。集群位于网关/边缘节点后面,边缘节点上只安装网关服务(例如,httpfs、hive网关、spark网关、oozie)如何在使用边缘节点运行Hadoop群集时连接到Impala,hadoop,cloudera,impala,gateway,Hadoop,Cloudera,Impala,Gateway,我已经使用Cloudera Manager安装了Hadoop集群,目前所有数据节点上都运行着Impala守护进程。集群位于网关/边缘节点后面,边缘节点上只安装网关服务(例如,httpfs、hive网关、spark网关、oozie) 我想知道如何使用Gateway/Edge node连接Impala,因为所有Impala守护进程都运行在群集的数据节点上,并且Gateway/Edge node没有提供任何服务。您可以在边缘节点上安装haproxy: 您可以在边缘节点上安装impala CLI。问题不
我想知道如何使用Gateway/Edge node连接Impala,因为所有Impala守护进程都运行在群集的数据节点上,并且Gateway/Edge node没有提供任何服务。您可以在边缘节点上安装haproxy:
您可以在边缘节点上安装impala CLI。问题不是impala CLI,我已经在边缘节点上安装了impala CLI。问题是我的hadoop集群位于边缘节点后面,所以要在我的hadoop集群上执行任何操作,我必须连接到数据节点上运行的一个impala守护进程,我无法从外部连接它。我将尝试法查建议的HA方法。呃。。。请注意,在“HAProxy”中,重要的部分是代理,而不是HA。。。因为该代理将成为事实上的SPOF。高可用性就到此为止。是的,没错,我只是在寻找代理服务,它可以将我的流量重定向到集群中运行的一个impala守护进程。