Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/linux/25.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Linux 在EC2上哪里可以找到Hadoop的AMI?_Linux_Hadoop_Amazon Web Services_Amazon Ec2_Bioinformatics - Fatal编程技术网

Linux 在EC2上哪里可以找到Hadoop的AMI?

Linux 在EC2上哪里可以找到Hadoop的AMI?,linux,hadoop,amazon-web-services,amazon-ec2,bioinformatics,Linux,Hadoop,Amazon Web Services,Amazon Ec2,Bioinformatics,我正在尝试在AmazonEC2上永久地安装Hadoop。目前我正在做的是每天早上启动EC2实例并设置Hadoop。有什么办法可以避免这一繁琐的步骤吗?我正在寻找一个Hadoop映像,它可以加载到EC2上,使我的事情变得简单 我知道我可以将EMR用于hadoop服务。但是我不知道如何在不提交作业流的情况下启动EMR(hadoop)集群。我的意思是,我需要一个hadoop集群,其中不运行任何作业 最终,我的目标是运行生物信息学应用程序,如和。要运行这些应用程序,有许多依赖项。所以我需要一个免费的ha

我正在尝试在AmazonEC2上永久地安装Hadoop。目前我正在做的是每天早上启动EC2实例并设置Hadoop。有什么办法可以避免这一繁琐的步骤吗?我正在寻找一个Hadoop映像,它可以加载到EC2上,使我的事情变得简单

我知道我可以将EMR用于hadoop服务。但是我不知道如何在不提交作业流的情况下启动EMR(hadoop)集群。我的意思是,我需要一个hadoop集群,其中不运行任何作业

最终,我的目标是运行生物信息学应用程序,如和。要运行这些应用程序,有许多依赖项。所以我需要一个免费的hadoop集群来设置环境,然后运行这些应用程序。 我希望我想做的事情很清楚


谢谢。

这更多的是配置管理和自动化问题。尝试CMT,如chef和puppet,根据您的需要完成这项工作。

这更多是一个配置管理和自动化问题。尝试CMT,如chef and puppet,根据您的愿望完成此操作。

您可以执行以下操作之一:

备选案文1。使用您最喜欢的Linux发行版,从一个支持EBS的EC2实例开始。继续安装所需的Hadoop软件。根据您需要的实例类型(主/从等)创建尽可能多的EC2实例。然后,您可以在AWS控制台中创建自己的AMI(右键单击EC2实例并单击“创建AMI”)。然后,您可以基于此AMI启动您自己的实例,数量可以根据需要而定。您也可以从实例存储备份实例创建AMI,但这将意味着将所有内容转储到S3并从S3创建AMI。有很多关于这方面的教程,如果您需要说明,请留下评论:)

备选案文2。从基于Hadoop的AMI开始,在完成自己的配置/添加依赖项后重复上述步骤。我继续从AWS控制台搜索Hadoop AMI,在EU-West-1中有48个(不确定您使用的是哪个区域)

备选案文3。以交互模式启动EMR群集。还可以选择在完成作业流后保持集群活动。如果您还为EMR实例设置了EC2密钥,那么您应该能够通过SSH将它们连接到一起,并拥有一个功能强大的Hadoop集群(虽然不确定依赖关系,但是您最好使用自己的集群)


我希望我正确地理解了您想要实现的目标,这对我有一点帮助。

您可以做以下一项:

备选案文1。使用您最喜欢的Linux发行版,从一个支持EBS的EC2实例开始。继续安装所需的Hadoop软件。根据您需要的实例类型(主/从等)创建尽可能多的EC2实例。然后,您可以在AWS控制台中创建自己的AMI(右键单击EC2实例并单击“创建AMI”)。然后,您可以基于此AMI启动您自己的实例,数量可以根据需要而定。您也可以从实例存储备份实例创建AMI,但这将意味着将所有内容转储到S3并从S3创建AMI。有很多关于这方面的教程,如果您需要说明,请留下评论:)

备选案文2。从基于Hadoop的AMI开始,在完成自己的配置/添加依赖项后重复上述步骤。我继续从AWS控制台搜索Hadoop AMI,在EU-West-1中有48个(不确定您使用的是哪个区域)

备选案文3。以交互模式启动EMR群集。还可以选择在完成作业流后保持集群活动。如果您还为EMR实例设置了EC2密钥,那么您应该能够通过SSH将它们连接到一起,并拥有一个功能强大的Hadoop集群(虽然不确定依赖关系,但是您最好使用自己的集群)


我希望我正确地理解了您想要实现的目标,这会有一点帮助。

我确实尝试了前两个选项;但是我遇到了一些错误。最终我使用Whirr来建立hadoop。到目前为止还没有这样的问题。不管怎样,谢谢你的帮助。我确实尝试了前两种选择;但是我遇到了一些错误。最终我使用Whirr来建立hadoop。到目前为止还没有这样的问题。无论如何,谢谢你的帮助。