HBase列族位置
五台服务器上都有HBase,其中一个表包含一个列族,我应该对每个键执行一些HBase列族位置,hbase,column-family,Hbase,Column Family,五台服务器上都有HBase,其中一个表包含一个列族,我应该对每个键执行一些map任务并保存结果。 主要问题是: 要保持数据局部性,哪一个更好:在现有表上创建新列族还是创建新表 下一个问题是: HBase文档建议保持低于三列的系列,正如我所说,我有十多个map任务,并且希望将每个结果保留在新的列系列中。我该怎么办?因为每个map任务与另一个任务不同。局部性保持和搜索成本非常重要 哪一个更好:在现有表上创建新列族 或创建新表 我建议您更多地关注模式和表设计的简单性,而不是试图破解HBase内部以获得
map
任务并保存结果。
主要问题是:
要保持数据局部性,哪一个更好:在现有表上创建新列族还是创建新表
下一个问题是:
HBase文档建议保持低于三列的系列,正如我所说,我有十多个map
任务,并且希望将每个结果保留在新的列系列中。我该怎么办?因为每个map
任务与另一个任务不同。局部性保持和搜索成本非常重要
哪一个更好:在现有表上创建新列族
或创建新表
我建议您更多地关注模式和表设计的简单性,而不是试图破解HBase内部以获得最佳性能。如果来自这两个列族的信息是相关的,并且您需要在map reduce扫描中访问这两个CFs,请将它们保存在同一个表中。如果信息是100%独立的,您将永远不需要同时扫描它们-将它们保存在不同的表中。同样,这是一个模式设计问题,不要试图进行过早的优化
第二个问题——我不明白你在想什么,抱歉。你能给一份关于每张表大约3个栏族的文档链接吗?@阿达姆斯沃克,请考虑这个链接,谢谢链接。请注意,此建议主要是关于编写不同的CF。对于阅读而言,它并不真正重要。