Amazon s3 您可以在EC3上从Hadoop访问EMRFS吗

Amazon s3 您可以在EC3上从Hadoop访问EMRFS吗,amazon-s3,amazon-ec2,Amazon S3,Amazon Ec2,对EMRFS的访问是仅限于EMR,还是可以从安装在EC2上的Hadoop访问。 有人能指出一些关于AWS如何管理从S3到Hadoop集群的数据传输以进行处理的文章吗。EMRFS与S3a相比如何更高效?EMRFS是一种由EMR访问s3的实现,因此,您将无法在安装了EC2的hadoop中使用它 在EC2上使用Hadoop时,必须使用Hadoop aws模块(包含s3a) 就性能而言,我不确定是否存在重大差异或影响。(这是非常主观的,您可能需要进行性能测试来验证这一点)。但emrfs和s3a之间有一

对EMRFS的访问是仅限于EMR,还是可以从安装在EC2上的Hadoop访问。
有人能指出一些关于AWS如何管理从S3到Hadoop集群的数据传输以进行处理的文章吗。EMRFS与S3a相比如何更高效?EMRFS是一种由EMR访问s3的实现,因此,您将无法在安装了EC2的hadoop中使用它

在EC2上使用Hadoop时,必须使用Hadoop aws模块(包含s3a)

就性能而言,我不确定是否存在重大差异或影响。(这是非常主观的,您可能需要进行性能测试来验证这一点)。但emrfs和s3a之间有一个主要区别。EMRFS在一段时间内提供了强大的一致性。这在需要写后读一致性(如HBASE和其他应用程序)的情况下非常有用

请注意,ApacheHadoop还与s3guard构建了类似的强一致性模型

一般的经验法则是在使用EMR时使用EMRFS,在使用其他hadoop发行版时使用s3a实现