Hadoop HBase是否稳定,生产准备就绪?

Hadoop HBase是否稳定,生产准备就绪?,hadoop,hbase,Hadoop,Hbase,对于那些在自己的集群上部署了HBase的人来说,您觉得它对于生产使用是否足够稳定?您遇到过哪些类型的麻烦或问题 我确实看到有很多公司在生产中使用HBase(),但我很好奇,是否有大量的维护、修补和firedrills用于保持HBase群集的正常运行。HBase即将迎来HBase-0.20的一个重要里程碑。有一个alpha,很快就会有一个RC。它的性能有了很大的改进。据报道,StumbleUpon和其他公司一样,为他们的站点提供了HBase的主干版本,没有额外的缓存层。所以我想说,它绝对可以投入生

对于那些在自己的集群上部署了HBase的人来说,您觉得它对于生产使用是否足够稳定?您遇到过哪些类型的麻烦或问题


我确实看到有很多公司在生产中使用HBase(),但我很好奇,是否有大量的维护、修补和firedrills用于保持HBase群集的正常运行。

HBase即将迎来HBase-0.20的一个重要里程碑。有一个alpha,很快就会有一个RC。它的性能有了很大的改进。据报道,StumbleUpon和其他公司一样,为他们的站点提供了HBase的主干版本,没有额外的缓存层。所以我想说,它绝对可以投入生产使用

Ryan Rawson(StumbleUpon的)最近在nosql会议上对此进行了讨论,主要是关于它在过去6个月里取得了多大进展。如果你不想看整件事,这里有幻灯片。除了性能改进之外,另一个主要的补充是它现在与zookeeper集成,因此master不再是单一的故障点

由于文件格式的限制,HBase过去常常会出现内存问题,导致单元大小过小。新的自定义文件格式也解决了这一问题,这也提高了性能

我已经用HBase做了大约一年的实验,我已经准备好信任0.20和生产服务,我不太相信旧版本。在进行实验时,我建议至少使用4或5节点的devcluster

我真的无法评论关注生产集群是什么感觉,因为我们才刚刚开始生产集群。一个有帮助的方面是邮件列表非常活跃,irc经常被使用,所以至少有一个非常强大的社区可以提供帮助