Hadoop HBase到配置单元映射表未显示完整数据

Hadoop HBase到配置单元映射表未显示完整数据,hadoop,hive,hbase,hadoop2,Hadoop,Hive,Hbase,Hadoop2,我们有一个带有1列族的HBase表,其中有15亿条记录 已使用命令检索HBase行计数 "count '<tablename>'", {CACHE => 1000000}. 但是当我们使用下面的命令检索配置单元行数时 select count(*) from stagingdata; 它在配置单元映射表中仅显示1.4亿行 我们已经尝试了类似的方法,用于具有1亿条记录的较小HBase,完整记录显示在配置单元映射表中 我的问题是为什么完整的15亿条记录没有出现在蜂巢中 我们有什

我们有一个带有1列族的HBase表,其中有15亿条记录

已使用命令检索HBase行计数

"count '<tablename>'", {CACHE => 1000000}.
但是当我们使用下面的命令检索配置单元行数时

select count(*) from stagingdata;
它在配置单元映射表中仅显示1.4亿行

我们已经尝试了类似的方法,用于具有1亿条记录的较小HBase,完整记录显示在配置单元映射表中

我的问题是为什么完整的15亿条记录没有出现在蜂巢中

我们有什么遗漏吗

如能立即答复,我们将不胜感激。 谢谢
Madhu.

您在hive中看到的是每个密钥的最新版本,而不是密钥的所有版本

当前无法访问HBase时间戳属性,并且 查询总是使用最新的时间戳访问数据


您在配置单元中看到的是每个密钥的最新版本,而不是密钥的所有版本

当前无法访问HBase时间戳属性,并且 查询总是使用最新的时间戳访问数据


嗨,谢谢你的快速回复。但是,在我们的例子中,Hbase密钥是名称+时间戳的组合。因此,在hbase中,我们只有一个版本的唯一键,并且hbase表中没有重复的键。您好,感谢您的快速响应。但是,在我们的例子中,Hbase密钥是名称+时间戳的组合。因此,在hbase中,我们有唯一的键,只有一个版本,并且hbase表中没有重复的键。
select count(*) from stagingdata;