我应该使用哪个版本的Hadoop?

我应该使用哪个版本的Hadoop?,hadoop,Hadoop,Hadoop目前有三个分支:0.2x、1.x和2.x。支持使用一个而不是另一个的论点是什么?Hadoop最近改变了它的Map/Reduce实现(现在称为纱线)。这可能是选择相对较新版本的原因之一 如果您想将Hadoop与其他相关项目(如HBase)结合使用,那么版本向量并不是那么简单 您可能想看看Cloudera的产品(我不是Cloudera的附属公司)。它们提供了分发版,您可以从中选择适合彼此的工具子集。当然,他们也提供专业服务 解决hadoop版本太多的一种方法是使用Cloudera产品。这

Hadoop目前有三个分支:0.2x、1.x和2.x。支持使用一个而不是另一个的论点是什么?

Hadoop最近改变了它的Map/Reduce实现(现在称为纱线)。这可能是选择相对较新版本的原因之一

如果您想将Hadoop与其他相关项目(如HBase)结合使用,那么版本向量并不是那么简单


您可能想看看Cloudera的产品(我不是Cloudera的附属公司)。它们提供了分发版,您可以从中选择适合彼此的工具子集。当然,他们也提供专业服务

解决hadoop版本太多的一种方法是使用Cloudera产品。这样的产品让您更轻松,您不必太担心配置。

它们看起来都很新。最新的一个是目前的0.2x分支!或者可能是2.x快照?cdh4包含2.0.0(至少在包中是这样说的)Cloudera发行版中包含的一些包看起来相当过时;e、 g.Mahout落后了一两个版本。有可能更新选定的组件吗?我在Hadoop空间中开始时损失了一些重要的时间,因为没有一起工作的版本,而且找到哪些版本一起工作的信息并不总是微不足道的。如果您知道一个组件依赖于什么,并且版本是兼容的,那么这可能很有效。不过要小心。