Hadoop 在远程群集上使用Hbase运行Map Reduce

Hadoop 在远程群集上使用Hbase运行Map Reduce,hadoop,hbase,apache-pig,bigdata,Hadoop,Hbase,Apache Pig,Bigdata,我有一个HBase集群,它有特定的数据。我还有一个hadoop集群,它也有一些数据。现在可以使用hbase集群中的数据在hadoop集群上运行map reduce作业了吗?我们如何使用pig实现这一点?您将遇到的主要问题是能否通过网络从映射器和还原器直接访问HBase区域服务器。您的服务器是否有直接的通信线路?Hadoop集群的大多数网络都是设置好的,所以这种访问是不可能的,需要某种网关。如果你真的设置了这个,你就没有任何理由不能按照你的建议去做 下一个问题是这是否是个好主意。两个集群之间的网络

我有一个HBase集群,它有特定的数据。我还有一个hadoop集群,它也有一些数据。现在可以使用hbase集群中的数据在hadoop集群上运行map reduce作业了吗?我们如何使用pig实现这一点?

您将遇到的主要问题是能否通过网络从映射器和还原器直接访问HBase区域服务器。您的服务器是否有直接的通信线路?Hadoop集群的大多数网络都是设置好的,所以这种访问是不可能的,需要某种网关。如果你真的设置了这个,你就没有任何理由不能按照你的建议去做


下一个问题是这是否是个好主意。两个集群之间的网络链接是什么?1GigE?该链接是否被其他人使用?

请解释,如果可能,我如何进行通信,例如在何处指定目标hbase服务器以获取数据。