Hadoop HBase能否提供对其单元的实时写/读访问?

Hadoop HBase能否提供对其单元的实时写/读访问?,hadoop,hbase,Hadoop,Hbase,我从一些消息来源听说HBase是一个基于Hadoop的“批处理”过程,所以我不确定HBase是否能够提供对其单元的实时写/读访问 例如,对于应用程序要写入HBase表中某个单元格的数据,HBase是否需要通过Map Reduce中使用的批处理过程将数据放入该单元格?如果是这种情况,则在批处理过程完成之前,此应用程序无法从HBase读取这段新数据 任何帮助都将不胜感激 是的,它确实提供了“实时”访问 您所指的“批处理”过程是Hadoop上的MapReduce。HBase仅依赖HDFS进行存储,不依

我从一些消息来源听说HBase是一个基于Hadoop的“批处理”过程,所以我不确定HBase是否能够提供对其单元的实时写/读访问

例如,对于应用程序要写入HBase表中某个单元格的数据,HBase是否需要通过Map Reduce中使用的批处理过程将数据放入该单元格?如果是这种情况,则在批处理过程完成之前,此应用程序无法从HBase读取这段新数据


任何帮助都将不胜感激

是的,它确实提供了“实时”访问


您所指的“批处理”过程是Hadoop上的MapReduce。HBase仅依赖HDFS进行存储,不依赖mapreduce。

我唯一的另一个问题是-那么HBase使用什么机制向其表写入/读取数据(如果表存储在联网的群集服务器中?),谢谢!HDFS文档将为您提供一个良好的概述。HBase使用HDFS API,从中抽象出(大部分)与分布式存储相关的问题。谢谢Ambar。从应用程序开发人员的角度来看,使用API似乎可以消除一些分布式存储问题。然而,如果我们深入研究这些API背后的东西,我仍然不确定数据是如何传输和存储在数据节点中的。我们是否可以假设API总是与主节点通信,然后立即实时地将数据写入数据节点,而不是通过批处理来写入数据节点?“实时”在这里是一个不好的术语。我更喜欢术语行“在线”。HBase可以非常快,但它不能保证它响应给定请求的速度。@David在这里的术语是正确的。user1660652,正如我所说,没有像mapreduce那样的批处理。从应用程序开发人员的角度来看,主要有get和put风格的操作,这些操作是同步的,一旦成功(或失败)就会返回。