Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ember.js/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
HBase count shell命令_Hbase - Fatal编程技术网

HBase count shell命令

HBase count shell命令,hbase,Hbase,我知道shell命令count将给出表中的行数/行数。但这里表示的间隔和缓存是什么?。我上网查过了。几乎所有的网站都有相同的解释 默认情况下,当前计数每1000行显示一次。可以选择指定计数间隔。默认情况下,计数扫描启用扫描缓存。默认缓存大小为10行。如果我们的行很小,您可能需要增加此参数。示例: 我不明白他们在解释什么 hbase> COUNT 't1', INTERVAL => 100000 hbase> COUNT 't1', CACHE => 1000 hbase&

我知道shell命令count将给出表中的行数/行数。但这里表示的间隔和缓存是什么?。我上网查过了。几乎所有的网站都有相同的解释

默认情况下,当前计数每1000行显示一次。可以选择指定计数间隔。默认情况下,计数扫描启用扫描缓存。默认缓存大小为10行。如果我们的行很小,您可能需要增加此参数。示例:

我不明白他们在解释什么

hbase> COUNT 't1', INTERVAL => 100000
hbase> COUNT 't1', CACHE => 1000
hbase> COUNT 't1', INTERVAL => 10, CACHE => 1000

有人能简单地解释一下吗?

您只需使用一个大表(超过2000行)来运行
count
命令,就可以看到它们是如何工作的

由于
count
操作可能需要很长时间,因此它会不断打印当前结果,如下所示:

Current count: 1000, row: ...                                                                                          
Current count: 2000, row: .....                                                                                                     
Current count: 3000, row:  ....
因此,如果间隔为1000,则每当计数过程达到1000时,它都会打印

Cache
只是
scan
命令的缓存。基本上,如果增加缓存配置,计数过程会更快,但会消耗更多内存,因此它说:

如果行的大小较小,则可能需要增加此值 参数


@马洛夫福克斯解释得很好

然而,缓存有点混乱。为什么缓存会使计数更快?它不需要记住它计算的行数。重要的是有多少行,而不是它们的内容

事实证明,缓存有点用词不当,缓存应该更恰当地命名为buffer或batch size。它是每个RPC到HBase返回的行数。如果数字太低,您的开销可能会增加,计数可能会慢得多

更多信息请点击此处: