Amazon web services 无法在AWS实例上恢复已停止的云

Amazon web services 无法在AWS实例上恢复已停止的云,amazon-web-services,yarn,solrcloud,cloudera-manager,Amazon Web Services,Yarn,Solrcloud,Cloudera Manager,我一直致力于在AWS上安装solr cloud。由于fresh run一切正常,而且我使用Hadoop作为依赖项之一,因此可以理解它具有高可用性。。基于此,我试图阻止cloudera管理器(基本上冻结了hadoop、solr和其他组件)。然后停止实例,第二天返回以恢复工作。。但这一理论永远行不通。。下面是我在关机和恢复之前一步一步做的事情 7:55,为每个datanode和~/recovery目录创建文件夹,并检查每个节点的运行状况 使用help 2.*.sh脚本从所有9台主机复制了nameno

我一直致力于在AWS上安装solr cloud。由于fresh run一切正常,而且我使用Hadoop作为依赖项之一,因此可以理解它具有高可用性。。基于此,我试图阻止cloudera管理器(基本上冻结了hadoop、solr和其他组件)。然后停止实例,第二天返回以恢复工作。。但这一理论永远行不通。。下面是我在关机和恢复之前一步一步做的事情

  • 7:55,为每个datanode和~/recovery目录创建文件夹,并检查每个节点的运行状况
  • 使用help 2.*.sh脚本从所有9台主机复制了namenode当前目录nn+dn
  • 已停止cloudera manager并准备关闭群集
  • 8:04时,cloudera manager中的群集停止。确保上述事件2和3之间有足够的时间
  • 在8:05物理停止aws实例
  • 一切都在8点08分停止
  • 再次启动所有节点。。八点十二分
  • 一开始一切都很好。。HDFS丢失了一些块,一些损坏,一些丢失
  • Solr云失败了。。完全是因为观测到的大多数块体都属于solr云
  • 正如你所见,我已经采取了所有的预防措施,甚至我已经重新分配了我在关机前保存的nn+dd。但是它不起作用

    这是我第四次失败,恢复云是一个痛苦的过程。 为什么我要这样做,我想在我们不进行任何测试的情况下为客户节省一些有价值的钱

    我仍然不确定为什么我可以从物理机器而不是aws恢复。。为什么只有Solr释放字节