hdfs与hbase的区别

hdfs与hbase的区别,hbase,hdfs,Hbase,Hdfs,我是Hadoop的新手。我正在阅读专业的Hadoop解决方案书,以获得一些关于Hadoop和生态系统的知识。我想澄清HDFS和HBase之间的主要区别。我的理解是,两者都是存储系统。它们仅在访问数据方面有所不同。HBase通过NoSQL访问数据,HDFS使用计算框架(MapReduce)处理数据。如果是这种情况,为什么不能呢?我们只能有一个存储HDFS或HBase。根据需求,他们将插入和插入框架。我的假设可能是错误的,如果有任何一条评论并提供它们之间的正确关系,那就太好了。HBase具有HDFS

我是Hadoop的新手。我正在阅读专业的Hadoop解决方案书,以获得一些关于Hadoop和生态系统的知识。我想澄清HDFS和HBase之间的主要区别。我的理解是,两者都是存储系统。它们仅在访问数据方面有所不同。HBase通过NoSQL访问数据,HDFS使用计算框架(MapReduce)处理数据。如果是这种情况,为什么不能呢?我们只能有一个存储HDFS或HBase。根据需求,他们将插入和插入框架。我的假设可能是错误的,如果有任何一条评论并提供它们之间的正确关系,那就太好了。

HBase具有HDFS无法提供的插入和更新(put)等属性。 HDFS只支持附件

使用HDFS和HBase有很多原因。

HDFS

  • 用于存储的Hadoop分布式文件系统
  • 遵循写一读多架构
  • 无法实时使用它,因为map reduce需要一些时间才能完成
HBase

  • 面向键对列的NoSQL数据库
  • 构建在HDFS之上
  • 存储可以是本地文件系统或HDFS
  • 可用于实时数据访问
  • 有关详细信息,请参见HBase官方页面

看看这个

它们都是存储系统吗。为什么他们不能在Hadoop生态系统中只保留一个呢。我认为这两个文件是紧密耦合的,我们不能从生态系统中取出任何一个。根据我们的业务需求(如果我们有更多的写入/读取),我们可以正确选择其中任何一个。例如,如果我想存储一些数据文件,我应该将它们放在hdfs或hbase中的什么位置(我的要求是更多的写入)HBase构建在HDFS之上,用于在运行时访问数据。HBase仅在HDFS上存储数据。当你们在实际问题中使用它时,你们可以了解更多。可能重复的