当HBase表跨多个区域拆分时,如何计算区域中的行数

当HBase表跨多个区域拆分时,如何计算区域中的行数,hbase,Hbase,如何使用hbase外壳计算区域中的记录数?如果有一个区域,我可以扫描该表并获取记录数,但如果该表被拆分为多个区域,我可以在hbase外壳上使用命令获取此信息吗?谢谢 您可以在shell中列出给定键范围(区域)的行: 其中myStart和myEnd是区域的开始键/结束键边界。(检查http://myhost:60030/rs-状态) 如果只想获得总行数,请运行作业: 例如: 结果将存储在行计数器映射器中 另一方面,如果您需要频繁地计数,可以考虑在服务器端实现一个运行。 可以找到进一步的讨论。您可以

如何使用hbase外壳计算区域中的记录数?如果有一个区域,我可以扫描该表并获取记录数,但如果该表被拆分为多个区域,我可以在hbase外壳上使用命令获取此信息吗?谢谢

您可以在shell中列出给定键范围(区域)的行:

其中myStart和myEnd是区域的开始键/结束键边界。(检查
http://myhost:60030/rs-状态

如果只想获得总行数,请运行作业: 例如:

结果将存储在行计数器映射器中

另一方面,如果您需要频繁地计数,可以考虑在服务器端实现一个运行。


可以找到进一步的讨论。

您可以在shell中列出给定键范围(区域)的行:

其中myStart和myEnd是区域的开始键/结束键边界。(检查
http://myhost:60030/rs-状态

如果只想获得总行数,请运行作业: 例如:

结果将存储在行计数器映射器中

另一方面,如果您需要频繁地计数,可以考虑在服务器端实现一个运行。 可以找到进一步的讨论

f_keyonly = org.apache.hadoop.hbase.filter.KeyOnlyFilter.new();
f_firstkey = org.apache.hadoop.hbase.filter.FirstKeyOnlyFilter.new();
flist = org.apache.hadoop.hbase.filter.FilterList.new([f_keyonly, f_firstkey]);
scan 'mytable', {STARTROW => 'myStart', ENDROW => 'myEnd', FILTER =>  flist }
hadoop jar /path/to/hbase.jar rowcounter mytable --range=myStart,myEnd