如果我已经用Ambari安装了Hadoop,我可以用CDH安装第二个Hadoop吗?在同一台机器上

如果我已经用Ambari安装了Hadoop,我可以用CDH安装第二个Hadoop吗?在同一台机器上,hadoop,cloudera-cdh,ambari,Hadoop,Cloudera Cdh,Ambari,如果我已经在同三台机器上安装了带有Ambari的Hadoop集群,那么我可以拥有第二个带有CDH的Hadoop集群吗? 如果是,如何将原始群集上的数据迁移到新群集? 谢谢。是的,你可以,但这不是一项简单的任务。HDP和CDH服务之间存在端口冲突。因此,您必须为CDH群集选择不同的端口。另一个需要注意的痛点——两个集群都希望使用/etc/hadoop、/etc/hive、,。。。用于存储配置文件。因此,其中一个集群应该配置为使用不同的位置 关于数据迁移,请使用distcp。是的,您可以,但这不是一

如果我已经在同三台机器上安装了带有Ambari的Hadoop集群,那么我可以拥有第二个带有CDH的Hadoop集群吗? 如果是,如何将原始群集上的数据迁移到新群集?
谢谢。

是的,你可以,但这不是一项简单的任务。HDP和CDH服务之间存在端口冲突。因此,您必须为CDH群集选择不同的端口。另一个需要注意的痛点——两个集群都希望使用/etc/hadoop、/etc/hive、,。。。用于存储配置文件。因此,其中一个集群应该配置为使用不同的位置


关于数据迁移,请使用distcp。

是的,您可以,但这不是一项简单的任务。HDP和CDH服务之间存在端口冲突。因此,您必须为CDH群集选择不同的端口。另一个需要注意的痛点——两个集群都希望使用/etc/hadoop、/etc/hive、,。。。用于存储配置文件。因此,其中一个集群应该配置为使用不同的位置


关于数据迁移,请使用distcp。

您试图完成的任务称为“Ambari接管”或“集群接管”。有关更多信息,请参阅讨论

以下是一些重要的注意事项: 这将是非常具有挑战性和复杂的,因为在没有数据库备份的情况下,您必须执行新的Ambari设置并完成现有HDP集群的Ambari接管。您有三种选择:

  • 如果集群不是生产集群,并且有清理集群的可行性,那么我建议清理集群并使用Ambari设置新集群。这会节省你很多时间。即使有一些数据,只需权衡备份数据和进行新安装与执行Ambari接管的时间和精力权衡,如下面两个选项中的高层所述

  • 使用Ambari API的群集接管在新计算机上设置Ambari服务器和Ambari数据库。更新Ambari代理以指向Ambari服务器主机。使用Ambari API执行群集接管,即添加群集、添加主机、注册服务和组件、注册主机组件。请参阅下面的Ambari API。

  • 第三种选择是使用Ambari执行虚拟集群安装,然后在Ambari中更新配置

  • 注: 确保以固定频率进行数据库备份、安装目录和配置备份,并将它们移动到另一个备份服务器或HDFS,以避免由于硬件故障而出现进一步的问题。
    注意:请确保以后定期备份数据库、安装目录和配置备份,并将它们移动到另一个备份服务器或HDFS,以避免由于硬件故障而出现进一步的问题。

    您试图完成的任务称为“Ambari接管”或“群集接管”。有关更多信息,请参阅讨论

    以下是一些重要的注意事项: 这将是非常具有挑战性和复杂的,因为在没有数据库备份的情况下,您必须执行新的Ambari设置并完成现有HDP集群的Ambari接管。您有三种选择:

  • 如果集群不是生产集群,并且有清理集群的可行性,那么我建议清理集群并使用Ambari设置新集群。这会节省你很多时间。即使有一些数据,只需权衡备份数据和进行新安装与执行Ambari接管的时间和精力权衡,如下面两个选项中的高层所述

  • 使用Ambari API的群集接管在新计算机上设置Ambari服务器和Ambari数据库。更新Ambari代理以指向Ambari服务器主机。使用Ambari API执行群集接管,即添加群集、添加主机、注册服务和组件、注册主机组件。请参阅下面的Ambari API。

  • 第三种选择是使用Ambari执行虚拟集群安装,然后在Ambari中更新配置

  • 注: 确保以固定频率进行数据库备份、安装目录和配置备份,并将它们移动到另一个备份服务器或HDFS,以避免由于硬件故障而出现进一步的问题。 注意:请确保以后定期备份数据库、安装目录和配置备份,并将它们移动到另一个备份服务器或HDFS,以避免由于硬件故障而出现进一步的问题