HBase列族位置

HBase列族位置,hbase,column-family,Hbase,Column Family,五台服务器上都有HBase,其中一个表包含一个列族,我应该对每个键执行一些map任务并保存结果。 主要问题是: 要保持数据局部性,哪一个更好:在现有表上创建新列族还是创建新表 下一个问题是: HBase文档建议保持低于三列的系列,正如我所说,我有十多个map任务,并且希望将每个结果保留在新的列系列中。我该怎么办?因为每个map任务与另一个任务不同。局部性保持和搜索成本非常重要 哪一个更好:在现有表上创建新列族 或创建新表 我建议您更多地关注模式和表设计的简单性,而不是试图破解HBase内部以获得

五台服务器上都有HBase,其中一个表包含一个列族,我应该对每个键执行一些
map
任务并保存结果。 主要问题是:

要保持数据局部性,哪一个更好:在现有表上创建新列族还是创建新表

下一个问题是:

HBase文档建议保持低于三列的系列,正如我所说,我有十多个
map
任务,并且希望将每个结果保留在新的列系列中。我该怎么办?因为每个
map
任务与另一个任务不同。局部性保持和搜索成本非常重要

哪一个更好:在现有表上创建新列族 或创建新表

我建议您更多地关注模式和表设计的简单性,而不是试图破解HBase内部以获得最佳性能。如果来自这两个列族的信息是相关的,并且您需要在map reduce扫描中访问这两个CFs,请将它们保存在同一个表中。如果信息是100%独立的,您将永远不需要同时扫描它们-将它们保存在不同的表中。同样,这是一个模式设计问题,不要试图进行过早的优化


第二个问题——我不明白你在想什么,抱歉。

你能给一份关于每张表大约3个栏族的文档链接吗?@阿达姆斯沃克,请考虑这个链接,谢谢链接。请注意,此建议主要是关于编写不同的CF。对于阅读而言,它并不真正重要。